高運算頂級GPU主機伺服器
視頻渲染、AI人工智慧、科學模擬和機器學習

AI 人工智慧 GPU 主機

TAKI Cloud 提供 GPU 主機,可運行複雜的工作負載,如人工智能、機器學習和科學計算。
TAKI Cloud 提供對強大 NVIDIA GPU,用戶可以從各種 GPU 主機中進行選擇,
包括最多 8 卡 GPU 的選項,提供充足的計算能力來處理最苛刻的任務。

AI人工智慧主機產品優勢

GPU 主機

強大的計算性能

TAKI Cloud 提供卓越的計算性能,算力包括 A800\A100\H800\H100\4090\3090\T4,適用於各種複雜的計算任務。

高記憶體數

TAKI Cloud 提供 384GB ~ 1TB 記憶體(RAM),確保您的應用程式和工作負載能夠高效運行。

快速儲存

1.92TB ~ 3.84TB NVMe SSD 和 2 顆 480GB SATA SSD 組成的儲存系統,保證高速的數據讀寫速度,提高系統響應速度。

成本效益

我們的租賃價格相較於公有雲服務更具競爭力,為您提供高性能計算資源的同時,降低您的運營成本。

AI GPU Server

TAKI Cloud 讓您以租用攤提的方式,將資產成本轉為費用化,讓您省架高昂的成本消耗

雙卡 Tesla T4 GPU 主機

$8,000/月

雙卡 NVIDIA-Tesla T4-16GB
適用模型推理新的數據進行即時預測和推斷

CPU:Intel® Gold 4314/5218 *2
GPU:NVIDIA-Tesla T4-16GB *2
RAM:DDR4 32GB 2933MT *16
系統碟:480G SSD *1
儲存硬碟:4T SATA *1
頻寬:10MB (不限流量)
網卡:10GB SFP *2
電源:伺服器白金800W交流電源 *2

四卡 Tesla T4 GPU 主機

$14,700/月

四卡 NVIDIA-Tesla T4-16GB
適用模型推理新的數據進行即時預測和推斷

CPU:Intel® Gold 4314/5218 *2
GPU:NVIDIA-Tesla T4-16GB *4
RAM:DDR4 32GB 2933MT *16
系統碟:480G SSD *1
儲存硬碟:4T SATA *1
頻寬:10MB (不限流量)
網卡:10GB SFP *2
電源:伺服器白金800W交流電源 *2

單卡 RTX-4090 GPU 主機

$9,500/月

單卡 NVIDIA RTX-4090 24G
適用於快速處理大量的影像數據

CPU:I7-13700K *1
GPU:RTX 4090 24GB *1
RAM:32GB DDR4 5600
儲存硬碟:500GB NVMe M.2 *1
頻寬:10MB (不限流量)
網卡:2.5GB +10GB

RTX-3090 GPU 主機

$45,000/月

8卡 NVIDIA RTX-3090 24G
適用於遊戲開發、影視製作、虛擬實境

CPU:E5-2682 v4 *2
GPU:NVIDIA RTX-3090 *8
RAM:DDR4 3200*20
儲存硬碟:1.92T SSD*2 RAID1
頻寬:10MB (不限流量)
網卡:10G * 2
電源:2000 W 電源模組 *4

RTX-4090 GPU 主機

$60,000/月

8卡 NVIDIA RTX-4090 24G
適用於電影製作和虛擬實境等需要即時渲染

CPU:Intel 5318Y *2
GPU:NVIDIA RTX-4090 *8
RAM:32GB DDR4 3200*20
系統碟 480 SSD*1
儲存硬碟:NVMe 1.92TB *1
頻寬:10MB (不限流量)
網卡:25GB SFP28 *1
電源:2000 W 電源模組 *4

HGX A100 GPU 主機

$265,000/月

8顆 NVIDIA HGX A100 80G
NVIDIA®NVLink 硬體加速
適用人工智慧(AI)、數據分析和高性能運算(HPC) 應用程式的數據分析

CPU:Intel Xeon Platinum 6430 *2
GPU:NVIDIA HGX A100 80G *8
RAM:DDR4 3200 64GB *16
系統碟 480 SSD*2
儲存硬碟:NVMe 3.84TB *5
頻寬:10MB (不限流量)
乙太網卡:10GB *2
IB網卡:單Port 200GB *4
電源:2000 W 電源模組 *4

HGX H100 GPU 主機

$499,999/月

8顆 NVIDIA HGX H100 80G
NVIDIA®NVLink 硬體加速
適用人工智慧聊天機器人、推薦引擎、視覺人工智慧

CPU:Intel Xeon Platinum 8468 *2
GPU:NVIDIA HGX H100 80G *8
RAM:DDR4 3200 64G*32
系統碟 980G SSD*1
儲存硬碟:NVMe 7.68TB U.2 *2
頻寬:10MB (不限流量)
乙太網卡:10GB *2
IB網卡:單Port 400GB *2
電源:2000 W 電源模組 *4

HGX H200 GPU 主機

$---------/月

8顆 NVIDIA HGX H200 SXM 141G
NVIDIA®NVLink 硬體加速
適用人工智慧聊天機器人、推薦引擎、視覺人工智慧

TAKI GPU主機 應用場景

AI大模型訓練

適用於工程模擬與分析提供高效能、可擴展性和企業級可靠性。 整合工業製造企業所需的設計與模擬工具,並支援前後處理視覺化、模擬並行化應用互動化等功能。

生命科學

基於基因定序、標靶發現、虛擬篩選、蛋白質結構研究、分子動力學模擬等應用場景,為生命科學產業使用者提供一站式的生物資訊學及計算化學領域整體解決方案。

人工智慧

人工智慧模型訓練需要強大的運算力支撐,高效能運算為新材料研究、航空航天器設計、基因工程探索以及量子運算模擬等領域的發展帶來新的技術支援和解決方案。

大專院校科學研究

為大學教學與研究工作建構一個高效可靠的HPC集群,在容量、性能、擴展和管理等方面滿足大量計算需求,為科學研究人員解決資料儲存、數據分析性能等方面的挑戰。

藥物研發

高效能運算在藥物研發的若干環節發揮重要的作用,包括利用基因定序提供協助、潛在藥物標靶的研究、先導化合物的確定與優化等,甚至能為後續的臨床實驗等提供支援。

氣像海洋

滿足氣像海洋業務需求,如下載資料、模式運作、推播產品等;包括每個環節的自動化運作流程,涉及大量的開發工作;提供7×24小時全天候的服務保障,大幅提高業務運作成功率和穩定性。

High-performance GPU computing solutions

高性能 GPU 運算解決方案

TAKI Cloud 提供許多高效能運算解決方案,無論您是想解決資料中心或邊緣的深度學習和 AI、HPC、圖形或虛擬化方面的業務問題,幫助企業在快速建構高效能運算應用,加速企業的產品研究速度,協助企業飛黃騰達。

我們的方法

尋找一種能夠幫助您,為您的員工、您的企業和您客戶實現更多目標的合作夥伴關係。

諮詢與規劃服務

透過我們的專家團隊來幫助您制定正確的策略與實現目標。

管理服務

讓專家團隊協助管理與優化您託管環境與日常流程細節,使您領先於未來。

專業的服務

我們將設計一個解決方案,確保您充分使用您的應用程式,以便您可以加速為您的業務帶來新的機會。

狂熱的支援

我們會盡一切努力把工作做好,從第一次諮詢到持續運作,專注於您的成功,並在每一步細節為您提供支援。

AI 訓練

隨著對話式 AI、自然語言處理 (NLP) 和推薦系統的 AI 模型規模和復雜性日益增加,訓練 AI 時間急劇增加,導致生產力下降和成本上升。 TAKI Cloud GPU 主機 和完整的解決方案堆棧可顯著加速您的 AI 訓練,進而加快模型探索速度、節省成本和更快的投資回報。

AI 推論

在產品和服務中部署經過訓練的 AI 模型,並保證服務質量 (QoS),這些需要有高效能且多功的加速器輔助。 TAKI Cloud GPU 主機支援所有 AI 工作負載,並提供最佳推理解決方案,最大化結合負載能力、效率及靈活度,為終端使用者提供基於 AI 的最佳體驗。

AI 高效能運算

將 HPC 與人工智慧和機器學習融合一體,可推動運算科學的進步,為突破性的科學發展開啟康莊大道。而 TAKI Cloud GPU 主機 加速大規模 HPC 應用程式,可加速從天氣預報、能源勘探、運算流體動力學到生命科學等廣泛產業和領域。

GPU 繪圖視覺化

TAKI 的 NVIDIA RTX™ GPU 主機提供專業的工作站效能,用於運作當今工作負載,包括即時渲染、產品設計、工程模擬和內容創建等內容,同時可簡化管理,並確保敏感資料受到保護。

FAQ - 您的問題,由我們來回答!

什麼是 GPU 主機(GPU 伺服器)?

GPU 伺服器是配備了圖形處理器(GPU)的伺服器,主要利用 GPU 強大的平行處理能力和浮點運算能力,在處理大規模資料集和執行複雜運算任務時提供顯著的效能提升。

GPU 伺服器的主要功能包括大規模平行處理、浮點運算加速、圖形渲染與視覺化,以及深度學習訓練與推理等。 其應用領域廣泛,包括但不限於科學研究與工程模擬、人工智慧與機器學習、視訊處理與編解碼以及雲端遊戲與虛擬實境…等。

此外,GPU 伺服器也具備高擴展性和靈活性,能夠根據應用需求的變化和運算規模的擴大方便地進行擴展,支援多種GPU 加速技術,提供高效資料處理能力。

GPU 伺服器是一種高效能運算設備,適用於需要大規模平行處理和浮點運算的場景,能夠顯著提高運算效率和資料處理能力。

CPU 或中央處理單元是一種硬體元件,它是伺服器中的核心運算單元。 它可處理執行操作系統和應用程式所需的所有類型的運算任務。 圖形處理單元 (GPU) 是類似的硬件元件,但更專業。 相較於一般 CPU,它能夠更有效地處理平行執行的複雜數學運算。 雖然 GPU 最初是為處理遊戲和動畫中的圖形翻譯任務而建立,但現在其用途遠遠超出這種情況。

GPU 與 CPU 的比較如下表所示:

對比項目

GPU

CPU

算術運算單元(ALU)

擁有大量擅長處理大規模並發計算的算術運算單元(ALU)。

擁有強大的算術運算單元(ALU),但數量較少。

邏輯控制單元

擁有相對簡單的邏輯控制單元。

擁有複雜的邏輯控制單元。

緩存快取

擁有很少的緩存,且緩存用於服務線程,而不是用於保存訪問的資料。

擁有大量的快取結構,能夠將資料保存至緩存,從而提高存取速度,降低延遲。

回應方式

需要將全部任務整合後,再進行批次處理。

即時響應,單一任務的響應速度較高。

應用場景

適用於運算密集,相似度高,且多執行緒並行的高吞吐量運算場景。

適用於對響應速度有要求,且邏輯複雜的串列運算場景。

電腦圖形和動畫的出現,產生了 CPU 根本沒有設計進行處理的首個運算密集型工作負載。 例如,電玩遊戲動畫需要應用程式處理資料,以顯示數千個像素,每個像素都有自己的色彩、光線強度和移動。 當時 CPU 上的幾何數學計算造成效能問題。

硬體製造商開始認識到,卸載常見的多媒體導向任務可減輕 CPU 並提高效能。 如今,相較於 CPU,圖形處理單元 (GPU) 工作負載可更有效地處理多個運算密集型應用程序,例如機器學習和人工智能。

功能
CPU 與 GPU 之間的主要區別在於其功能。 服務器無法在沒有 CPU 的情況下執行。 CPU 會處理服務器上所有軟件正確執行所需的所有任務。 另一方面,GPU 支援 CPU 來執行平行計算。 GPU 可更快地完成簡單且重複的任務,因為它可以將任務分解為更小的元件以及平行完成任務。

設計
GPU 透過多個核心或算法邏輯單元 (ALU),在並行處理中表現出色。 GPU 核心的功能不如 CPU 核心,而且記憶體較少。 雖然 CPU 可在不同的指令集之間快速切換,但 GPU 只需大量相同的指令,並以高速推送它們。 因此,GPU 功能在平行運算中發揮著重要作用。

差異範例
為了更好地理解,請考慮以下類比。 CPU 就像一間大餐廳的主廚,必須確保數百個漢堡被翻轉。 即使主廚可以親自做到,這也並非以最佳方式利用時間。 當主廚完成這項簡單但耗時的任務時,所有廚房操作可能會停止或減慢速度。 為了避免這種情況,主廚可使用平行翻轉幾個漢堡的初級助理。 GPU 則更像是擁有十隻手的初級助理,可在 10 秒內翻轉 100 個漢堡。

模型訓練是指使用大量的資料對模型進行訓練和最佳化,例如深度神經網路的訓練。 大模型通常需要大量的顯存來儲存模型參數、梯度和中間計算結果。 較大的顯存容量可提供更高的批次大小和更複雜的模型結構,有助於提升模型的效能和準確度。 此外,大模型訓練需要進行大量的矩陣計算、張量操作和梯度更新等複雜的計算任務。

GPU擁有強大的平行運算能力,可同時處理多個運算任務,提升運算效率。 同時,GPU具有高速的記憶體頻寬和大容量顯存,可以儲存和處理大規模的資料集。 目前市面上最火熱的NVIDIA A100/H100都具備大學的平行運算能力和快速的資料傳輸能力,以支援平行訓練的效率和可擴展性。

模型推理是指使用訓練好的模型對新的數據進行即時預測和推斷,通常要求在較短的時間內處理大量的數據,例如即時影像辨識和語音辨識。 GPU具備較低的運算延遲和高吞吐量,能夠快速處理輸入資料並輸出推理結果,滿足即時性要求。 NVIDIA在Volta架構及其後續架構(如Ampere架構)中引入了Tensor Core,專門用於深度學習任務重的張量計算。

在AI推理情境下,NVIDIA的V100、Tesla T4、Tesla P40都較為適用。 此外,GeForce系列顯示卡其實也可以用於AI推理,例如目前較火熱的RTX 4090、RTX 3090,性價比會比企業級顯示卡高很多。

GPU伺服器在電腦圖形學領域有著廣泛的應用。 GPU具有高度平行的架構和專門的影像處理單元,可快速處理大量的影像資料。 同時,GPU具有豐富的影像處理庫和演算法,可實現各種複雜的影像處理操作。 例如,在遊戲開發、影視製作、虛擬實境等領域,GPU伺服器可以提高影像渲染速度,減少渲染時間,提高工作效率。

我們常說的RTX 4090,其中在框架中採用了第三代RT core,光線追蹤效能最高可提升2倍,主要用於遊戲開發、電影製作和虛擬實境等需要即時渲染的領域。 此外,NVIDIA的 RTX 3090、Tesla T4等都較為適用。