Deepseekとは?
Deepseekは2023年に中国で設立されたAI企業です。創業者のZhao Yonggang(趙永剛)氏は元ByteDanceのAI研究者で、同社のAIモデル開発を牽引してきた実力者として知られています。
以前もDeepseek社はAIモデルのコストパフォーマンスの良さから話題になったことを記憶してる方もいるかもしれません。
そんなDeepseek社ですが、今回は2024年11月20日に新しい言語モデル「DeepSeek-R1-Lite-Preview」をリリースしました。
このモデルは特にo1-previewレベルの数学的推論能力をベンチマークで示しており注目を集めています。
Deepseek-R1-Lite-Previewモデルとは?
1. 卓越した数学的推論力
AIME(American Invitational Mathematics Examination)ベンチマークで高いパフォーマンスを実現
MATH benchmarkでもo1-previewレベルの性能を達成
2. 思考プロセスの透明性
リアルタイムでの思考過程の可視化が可能
より詳細な推論ステップを確認できる
3. オープンソースなどの提供に関する取り組み
モデルのオープンソース化を予定
API提供も近日開始予定
実際に最新モデルを利用してみよう
Deepseekアプリにログイン
こちらのサイトにアクセスしてStart Nowを選択してください。

新規登録・ログインをしてください。

ログインすると、以下のように新規チャット画面が開きます。ここでDeep Thinkをオンにすると、最新のDeepseek-R1-Lite-Previewモデルが利用できます。
1日に無料で50回使えるので、課金は不要です。

それでは、実際に試してみましょう。
試験的に、Slackのようなチャットアプリの設計をしてもらいます。

このように、o1-previewと同様の思考のアウトプットを挟んでから実際のアウトプットを開始します。
かなり思考部分も長く、しっかり考えていることが見て取れます。


アウトプットもかなりボリュームが多く、様々な観点を考慮していることが読み取れます。
稀に中国語が混じるのが気になりますが、基本的に利用する分には問題となるほどではなさそうな頻度です。
思考が英語であることからも基本的には英語でアウトプットしてもらい、適宜必要な箇所をLLMなどで翻訳することで性能の良さを活かしつつ使うことができそうです。
以下はもう少し軽めにして社内で使う程度の用途向けに変更してもらった結果です。

和訳すると、以下のように実用性と軽度な開発という意図の2軸に沿ったアウトプットがしっかり出来ているようです。
主要機能:
ユーザー登録・ログイン:
メールとパスワードによる登録・ログイン
JWTによるステートレス認証
チャンネルとメッセージング:
チャンネルの作成と参加
WebSocket (Socket.io)によるリアルタイムテキストメッセージング
ファイル共有:
AWS S3またはローカルサーバーでのファイル添付・共有
メッセージ履歴:
過去メッセージの取得・表示
技術スタック:
フロントエンド: シンプルさを重視しJavaScriptまたはReact
バックエンド: API処理用のNode.js + Express
リアルタイム通信: Socket.io
データベース: PostgreSQL(信頼性重視)またはSQLite(シンプル重視)
ファイルストレージ: AWS S3またはローカルサーバー
データベーススキーマ:
Usersテーブル: user_id, email, password_hash, created_at
Channelsテーブル: channel_id, name, created_at
Messagesテーブル: message_id, channel_id, user_id, content, created_at
Filesテーブル: file_id, message_id, user_id, file_url, created_at
セキュリティ対策:
全通信にHTTPS
パスワードはbcryptでハッシュ化
インジェクション攻撃防止のデータバリデーション
デプロイメント:
HerokuやAWSなどのクラウドサービスを使用
GitHub Actionsによる自動デプロイ
テスト:
バックエンド機能のユニットテスト
APIエンドポイントの統合テスト
ユーザー操作のE2Eテスト
将来の拡張:
通知とユーザーステータス表示
ビデオ通話など高度な機能
開発ワークフロー:
Gitでバージョン管理
開発用・本番用のブランチ分け
CI/CD用のGitHub Actions
監視とログ:
Winstonによるログ実装
エラー追跡にSentryを検討
ユーザーオンボーディング:
アプリ内の簡単なガイド
従業員向け簡易トレーニングまたは共有ドキュメント
この計画は、基本機能と将来の拡張性に焦点を当てた軽量な社内チャットアプリケーションの基盤を提供します。
また、実際にアウトプットしてもらうと性能も良さそうですが速度もo1-miniと同じくらいと無料で50回使え、オープンソース化やAPI公開が予定されているものとしてはかなり破格な性能となっているように感じます。
Deepseek APIについて
料金プラン
現状Deepseek APIで利用できるAIモデルはdeepseek-coder、deepseek-chatの2つです。どちらも入力は$0.14 / 1M tokens、出力は$0.28/1M tokensであり、かなり安価であることが分かります。
コンテキストキャッシュ機能
DeepseekのAPIでチャット履歴などを元にテキスト生成を行う場合、例えばsystemプロンプトが同じ場合などにコンテキストキャッシュが行われます。
コンテキストキャッシュ機能は全ユーザーに対してデフォルトで有効になっているので、特に設定することなく同じプロンプトに対しては料金が10分の1になります。

この機能は、会話履歴を渡す際にこれまでの会話履歴+新規メッセージを送信する際も会話履歴分はキャッシュされ、安く利用することができますしfew-shotなど同じプロンプトを複数回渡し、最後の入力のみを変更して回答を生成する場合などにも有効です。
注意点としては、同じプロンプトであっても100%必ずキャッシュにヒットするわけではないようです。
キャッシュ システムは 64 個のトークンをストレージ ユニットとして使用します。64 個のトークン未満のコンテンツはキャッシュされません。
キャッシュ システムは「ベスト エフォート」方式で動作し、100% のキャッシュ ヒット率を保証するものではありません。
キャッシュの構築には数秒かかります。キャッシュが使用されなくなると、通常は数時間から数日以内に自動的にクリアされます。







