2023年12月7日、Google は GPT-4の最大の対抗馬とされていた「Gemini(ジェミニ)1.0」を発表しました。Geminiは3つのバージョンがあり、Nano, Pro, Ultra(一番性能が高い) となっています。GeminiはMMLU(大規模多目的言語理解)というベンチマークで人間の専門家を初めて上回る90.0%のスコアを達成する最強のモデルとなっています。本記事では、そのGeminiについて詳しく解説していきます。それでは、早速見ていきましょう。

Geminiの使い方
すでに、Gemini Proの改良版はBardにアクセスすることで誰でも使用することができます。ただし、いくつかの簡単なステップが必要です。まず、Google Chromeを開き、右上のドットメニューアイコンからアカウントをクリックします。

次に、左側のバーから「個人情報」を選択します。

そして、「ウェブ向け全般設定」の言語を英語(English)に変更します。


これで、Bardに戻ると最新モデル Geminiが実装された Bardを使用するこおとができます。
また、12月13日からGemini Pro APIはGoogle AI StudioやGoogle Cloud Vertex AIを通じてアクセス可能になり、Android開発者は、Android 14のAICoreでGemini Nanoを使用できるようになります。数ヶ月以内には、Search、Ads、Chrome、Duet AIでのGeminiの利用も開始されます。
Gemini Ultraは、信頼性と安全性のチェックを経た後、来年初めに開発者と企業に向けてリリースされるとのこと。同じく来年初めには、Gemini Ultraを搭載したBard Advancedも導入され、最先端のAI体験が提供される予定で、こちらも注目です。
そして、Pixel 8 ProではGemini Nanoを搭載し、録音アプリの「要約」機能やGboardの「スマート返信」機能で使えるようになります。
Geminiの性能
Geminiは、32の学術ベンチマークのうち30で最新の成果を上回るAIモデルです。特に、数学や物理、歴史、法律、医学、倫理など57の分野をカバーするMMLUテストで90.0%のスコアを獲得し、人間の専門家の成績を超えた初のモデルとなりました。また、マルチモーダルな理解を必要とする新しいMMMUベンチマークで59.4%という過去最高のスコアを達成。GeminiはOCRシステムの助けを借りずに、画像認識などのベンチマークで先行モデルを上回りました。これらの成果はGeminiの高度な推論能力を示しています。


Geminiの科学文献解析能力
Geminiは学術文献からのデータ抽出において顕著な理解を示します。Google DeepMindの研究者たちは、Geminiを使用して数千の科学論文から重要な情報を見つけ出し、抽出する作業を効率化しているとのこと。Geminiはテキスト情報だけでなく、図表に対しても推論できるマルチモーダル能力を持っており、データセットの更新や図表の生成も行えます。これらの機能は科学者だけでなく、法律や財務などデータセットに依存するあらゆる分野に応用可能です。
User: あなたは役立つ分岐点アシスタントです。
あなたの仕事は、以下の論文のタイトルとアブストラクトを読み、非コーディング変異に対する実験的検証が特定の人間の病気に関して語られているかどうかを教えることです。
念頭に置くべきいくつかのことがあります: 変異はSNPとも呼ばれることがあり、rsIDで参照されることがあります。 機能的変異または調節変異は通常、非コーディング変異です。 実験的検証は多くの形を取ることができます。いくつかのアッセイ方法は以下の名前を持っています:ChIP、CRISPR-Cas9、MPRA、EMSA、TALEN、ルシフェラーゼアッセイ。 実験的検証は、ファインマッピングのような統計的方法を含みません。
論文の詳細は以下の通りです:
----
{title}
{abstract}
----
この論文は、特定の人間の病気に対する非コーディング変異の実験的検証について語っていますか?



Geminiのマルチモーダル理解力
Geminiは、テキスト、画像、音声などのマルチモーダルな情報を認識し理解するために訓練されており、異なるニュアンスの情報を深く理解し、複雑な話題に対する質問に答えることができます。数学や物理などの複雑な科目における推論を説明するのに特に有効です。
https://www.youtube.com/watch?v=UIZAiXYceBI&t=24s
Geminiのコーディング能力
Geminiは、PythonやJava、C++、Goなどの主要プログラミング言語でコードを理解、説明、生成できます。プログラミング関連のベンチマークで優れた性能を発揮し、特にPythonで約200のプログラミング関数のベンチマークでは、初回で約75%を解決しています。Geminiによる自己検証と修正を許可すると、この数値は90%以上に跳ね上がります。競技プログラミングでは、AlphaCode2は参加者の約85%よりも優れたパフォーマンスを見せています。

最後に
いかがだったでしょうか? Gemin の発表により、今まで以上にAI開発競争が加速しています。Gemini公開から数時間後には、OpenAIの内通者よりGPT-4よりも性能が高いGPT-4.5がリリース予定であるというリークもありました。これは、Gemini Ultra の性能を早速超えてくる可能性があります。引き続き動向に目が離せません。
これからも継続的に ChatGPT/AI 関連の情報について発信していきますので、フォロー (@ctgptlb)よろしくお願いします。この革命的なテクノロジーの最前線に立つ機会をお見逃しなく!
別件:GPTs ラボ、始動します
GPTs の可能性は無限大で、うまく使いこなせれば、これほど有用なものはありません。
来年には GPTs Store が公開され、他の人に多く使われるほどに収益が得られるようになります。
GPTs Store は次世代のアプリストアです。
さらにマイクロソフトは、将来的にCopilotにもGPTsを搭載可能という事を先日発表しました。
GPTsは極めて重要なのですが、あまりにも発展スピードが早く、大量の情報を追うことが困難です。
そんな中、信頼性や網羅性のある、GPTs特化型メディア開発が急務と考え、「GPTsラボ」の開設を決意しました。
主なコンテンツです:
【ほぼ日刊 GPTsマガジン】
話題のGPTの深掘りや、本当に便利なGPTを日刊でお届け
【GPT用プロンプトノウハウ】
高度なGPTsの作り方の紹介やChatGPT研究所製GPTのプロンプトを完全公開プロンプトインジェクション対策
【参加特典】
あなたのGPTを無料PR(条件あり)
限定のGPTsコミュニティ
秘書GPTへのアクセス(早期限定)
https://agi-labo.com/articles/n905d3deb5449







