👋 こんにちは、はるなです。
今日のテーマは「低コストでChatGPTに匹敵するAIのDeepSeek誕生秘話」です。
おすすめの記事
🎧 iPad Workers Podcastは毎週、木曜日配信予定のポッドキャスト番組です。
リクエスト・感想などは #iPadWorkers のハッシュタグを付けて投稿してください。
🤑 大規模AIモデルの開発には莫大な資金と計算リソースが必要?
最近AI界隈で話題になっている「DeepSeek(ディープシーク)」をご存じですか?
中国のスタートアップ企業が開発したAIモデルで、ChatGPTのような高性能を持ちながら、開発コストを大幅に削減したことで話題になっています。
2025年1月25日に最新モデル「DeepSeek-R1」を正式リリース。このモデルは、数学や推論能力において業界のベンチマークを上回る性能を示しています。
ChatGPT-4相当の性能を持つ
開発コストがわずか9億円(約600万ドル)
無料で利用可能(今後も低コスト維持の見込み)
特に注目すべきは、その開発コストです。DeepSeekは、約600万ドル(約9億円)でこのモデルを開発しました。
Metaが開発した大規模言語モデル「Llama 3.1」の開発には数億ドル(数百億円)規模の投資が行われたと報じられています。そんな中、わずか10億円たらずでChatGPT-4並みのモデルが作れたというのは衝撃的なニュースだったのです。
これまで大規模AIモデルの開発には莫大な資金と計算リソースが必要とされてきましたが、DeepSeekはその常識を覆しました。
この低コストAIの誕生の背景には、意外なストーリーがあります。
💰 低コストAI誕生の背景
DeepSeekを開発したのは、もともと天才トレーダーとして知られる起業家リャン氏です。彼は運用ファンドで得た資金を活用しAI開発をスタートします。
しかし、その直後にアメリカ政府の規制が入り、中国企業による最新AIチップの購入が困難になりました。 最新のAIチップが入手困難になり「中国では高性能なAIは作れない」と言われる中、DeepSeekの開発チームは 「低コストで同等の性能を出す方法」 を模索し始めます。
そこで生まれたのが、 「限られた計算資源を最大限活用する新しいアプローチ」 でした。
🧠 Mixture of Experts(MoE)とは?
DeepSeekの開発チームは、限られた計算リソースを最大限に活用するために、「Mixture of Experts(MoE)」という技術を採用します。
MoEの基本的な考え方はシンプルで、「すべてのタスクを1つの巨大なモデルで処理するのではなく、得意分野ごとに専門家モデルを分けて処理する」 というものです。
MoEの仕組み
複数の専門家モデル(Experts)を用意
たとえば、「数学に強いモデル」「会話に特化したモデル」「画像生成に優れたモデル」など、異なる役割を持つモデルを作る。
タスクごとに適切な専門家を選択
入力された質問やタスクの種類に応じて、最適な専門家モデルを自動で選ぶ。
必要な専門家モデルだけを動かす
全部のモデルを同時に使うのではなく、必要な専門家だけを動作させることで、計算コストを抑える。
学習データを効率的に圧縮・最適化し、最小限のGPU時間でモデルを鍛え、推論プロセスを工夫し、低スペックなチップでも高品質な回答を生成できるようになったのです。
その結果、わずか280万GPU時間でChatGPT-4相当のモデルを作ることに成功します。 Metaの最新AI「Llama 3」は3000万GPU時間を要しており、その10分の1の時間しかかかっていません。
DeepSeekのAIモデルは、NVIDIAの「H800」チップを約2,000個使用してトレーニングされています。
これは、従来の大規模モデルが16,000個以上のチップを必要とするのと比較して、はるかに効率的です。
このようなDeepSeekのアプローチによって、 「高性能AIは巨額の資金がないと作れない」という常識が覆った のです。
🐳 DeepSeekの今後はどうなる?
現在、DeepSeekはアプリやWebから無料で利用可能です。
現時点ではDeepThink(深く考えるR1モデル)やWeb検索機能が無料で使えるので、ChatGPTなどに課金するほどではないが、推論モデルを試してみたいユーザーにはおすすめです。
今はユーザーを増やすフェーズのため無料で提供されていますが、今後は有料プランの導入が考えられます。ただし、開発コストが低いため、仮に有料化しても月1000円程度で済む可能性が高いと言われています。
ChatGPT Plus(月3000円程度)と比べると、圧倒的なコストパフォーマンスです。
DeepSeekのような 「低コスト・高性能AI」 の登場によって、生成AIの価格競争が加速し、より多くの人が手軽にAIを使える時代に進みそうです。
学習にChatGPTの出力結果を使用した可能性があることや、データ収集および保存のポリシーでは、ユーザーデータが中国国内のサーバーに保存されると明記されており、プライバシーや情報管理への懸念点はあります。しかし、それでもAI業界に大きなインパクトを与える存在になったことには間違いありません。
利用ユーザーとしては、AIツール同士が切磋琢磨してくれた方が安くて高性能なものが使えて嬉しいというのもあります。
ということで今日は「低コストでも高性能なDeepSeekの誕生秘話」についてでした。
Share this post