2024年2月8日、「Bard」は「Gemini」にブランド変更されました。なお、旧Bardでの会話の履歴はGeminiに変更後も引き継がれています。詳しくは下記記事をご参照ください。
今回は、2022年末リリースのChatGPTに対抗して、Googleが発表した「Gemini(旧Bard)」。特徴や違いなどを、箇条書き比較表、画像を用いながらわかりやすく解説していきます。この記事を最後まで読んで、性能に合わせた使い分けをマスターしていきましょう。
目次
Gemini(旧Bard)とは?
Gemini(旧Bard)は、Google AIが開発した、無料で利用可能な対話型AIです。リリース時の「Bard」から「Gemini」へと名称が変更され、同時に大幅なアップデートも行われました。
Geminiは、テキストとコードの膨大なデータセットでトレーニングされており、テキストを生成したり、言語を翻訳したり、質問に答えたりすることができます。さらに、詩、コード、台本、音楽作品、電子メール、手紙、ジョークなど、テキスト形式でさまざまなコンテンツを生成可能です。そのため、特に作家やマーケティング担当者など、クリエイティブな分野で活動する人々にとって非常に有用なツールとなるだろうとGoogleは強調しています。
Gemini(旧Bard)は日本語に対応しています。英語での入力と比べると、出力の精度に不安定さは残りますが問題なく利用できます。
Gemini(旧Bard)の概要や使い方は、下記記事をご参照ください。
ChatGPTとは?
引用:ChatGPT
ChatGPTとは、GPT-3.5 および GPT-4モデルを使用する、OpenAI によって開発された対話型AIです。2022年11月に初めて一般公開されました。
ChatGPT は、テキストとコードの大規模なデータセットでトレーニングされているため、人間レベルのテキストを生成し、言語を翻訳し、さまざまな種類のクリエイティブ コンテンツを作成し、質問に答えることができます。
ChatGPTの使い方について詳しくは下記記事をご覧ください。
Gemini(旧Bard)とChatGPTはどちらが優秀?
現時点では、回答の速度や精度、汎用性、機能性において、ChatGPTの方が優れていると考えられます。
ユーザーの間では、Gemini(旧Bard)は単純な質問の答えも間違える、ハルシネーション(幻覚)を起こしやすいなどと言われています。ハルシネーションとは、生成AIが正確でない情報をさも正確かのように回答してしまう(嘘の回答をする)課題のことです。
さらに、会話のログからユーザーの意図を推測する能力、コンテキスト・文脈の理解能力に関しては、ChatGPTが圧倒的に優れているといえます。
しかし、実はGemini(旧Bard)には、ChatGPTにはない便利な機能が数多く備わっています。具体的にはこの後記述しますが、例えば一度の回答で3つの回答案を提示したり、回答に画像や引用元を用いたり、Googleの様々なアプリケーションとシームレスに連携したりなどが可能です。今後さらに精度が向上すれば、双方の優劣の差は微々たるものになるかもしれません。
Gemini(旧Bard)とChatGPTそれぞれの特徴
Googleの「Gemini(旧Bard)」とOpen AIの「ChatGPT」それぞれの特徴は何でしょうか?強みと弱みと合わせて、箇条書きでご紹介します。
Gemini(旧Bard)の特徴
特徴
- Googleが開発した対話型AI
- クリエイティブなコンテンツ生成に特化した設計と目的
- 完全無料のAIチャット
強み
- 3つの回答案から最適なものをユーザーが選択できる
- ワンクリックでGoogle検索画面に移動できる
- Gmail、Googleドキュメント、Googleスプレッドシートと連携できる
- Google検索から画像を表示できる
- 引用のソースリンクを提示できる
- インターネットに接続されているため最新情報に対応している
弱み
- 単純な質問にも間違える場合がある
- 回答の速度が比較的遅い
- ユーザーとの以前の会話を記憶していない場合がある
- 一部最新機能が日本語に未対応な場合がある
ChatGPTの特徴
ChatGPTは無料版と有料版があり、機能が大幅に異なります。有料版(ChatGPT Plus)でのみ、または無料版でのみ適用される特徴に関してはその旨記述しています。
特徴
- OpenAIが開発した対話型AI
- 汎用的な用途を想定された設計
- 無料版と有料版(月20ドル)がある
強み
- 文脈を読み取る能力が高い
- より人間に近い、自然な会話ができる
- 回答速度が速い
- 詳細な条件の入力を回答に反映させることができる
- <有料版のみ>チャット上で画像生成ができる
- <有料版のみ>「GPTs」と呼ばれる専用の機能が利用できる※
- <有料版のみ>インターネットに接続されているため最新情報に対応できる
弱み
- 基本的には引用元を表示できない
- インターネット上の画像を引用した回答はできない
- 最新情報に対応していない場合がある
- 諸ツールとシームレスな連携はできない
※「GPTs」は、特定のタスクや知識に特化させた専用のチャットボットを、ノーコードで作成したり、販売したり、利用したりできる機能です。詳しくは下記記事をご参照ください。
Gemini(旧Bard)とChatGPTの違い
Google Gemini(旧Bard)とChatGPTは、自然言語処理(NLP)の領域で注目を集めている2つの高度なモデルですが、両者には基本的な違いがあります。WIREDのテスト結果によれば、レイアウトやツール、さらには“癖”などの特徴がそれぞれ異なり、「位置づけ」という点でも違いがあると指摘されています。
今回は以下の違いを取り上げます。
- 基本情報・機能
- 位置付け
- 会話ログ(履歴、文脈の理解)
- 設計・用途
- 情報の鮮度
- 情報ソースの引用
- LLM
- 連携
どのような違いがあるのかそれぞれ確かめていきましょう。
基本情報・機能の違い
Gemini(旧Bard) | ChatGPT (無料版) | ChatGPT Plus (有料版) | |
開発元 | OpenAI(Microsoft) | OpenAI (Microsoft) | |
LLM※ | Gemini (Bard時代は「Palm2」) | GPT-3.5 | GPT-4 |
情報データ | 2016〜2023年まで+ インターネット上の最新情報 | 2023年後半まで | 2023年後半まで+ インターネット上の最新情報 |
回答方法 | 質問1つにつき回答3つ、 最適なものを選択可能 | 質問1つにつき回答1つ | 質問1つにつき回答1つ |
画像を含む回答 | インターネット上の画像を 引用して回答できる | × | チャット上で画像生成が可能 (インターネット上の画像を 引用して回答できない) |
回答の速度 | ◯ | ◎ | △ |
回答の精度 | ◯ | ◯ | ◎ |
インターネット接続 | ◎ | × | ◎ |
音声入力 | ◎ | ◯ (モバイル版のみ) | ◯ (モバイル版のみ) |
画像入力(アップロード) | ◎ | × | ◎ |
引用・出典リンクの提示 | ◯ | × | ◯ |
アプリ・サービスとの連携 | ◯ | △ | △ |
※LLM:ChatGPTなどの「大規模言語モデル」、英語で「Large Language Model」の略称。LLMは膨大な量のテキストデータを学習し、そのデータのパターンや構造を理解することで、人間のように文章から文脈を理解し、質問や指示に対して適切な応答を生成する能力を持っています。詳しくは下記記事で解説しています。
位置付けの違い
Gemini(旧Bard)自体は、単なる検索エンジンではなく、「創造性と生産性を高めるパートナー」という位置づけです。Gemini(旧Bard)には検索とは別に専用のURLとUIが用意され、クリエイティブ分野に適した機能性を強調しています。具体的には詩、コード、スクリプト、楽曲、電子メール、手紙などのクリエイティブなテキスト形式の生成が可能です。
Gemini(旧Bard)が「創造性と生産性を高めるパートナー」であるとすれば、ChatGPTは「会話と学習パートナー」と言えます。Gemini(旧Bard)に比べ、文脈を理解する能力が高く、ユーザーとより自然な会話を楽しんだり、人間が書いたに近い文章を作成することができます。クリエイティブ分野のコンテンツ生成に特化してはいませんが、コンテンツ生成や検索を含むあらゆるタスクを、テキストベースで実行することができます。包括的な機能が備わっているため、教育やビジネスの現場での活躍も期待されています。
会話ログの違い
Gemini(旧Bard)は2023年7月時点で、会話のログが残るようになり、さらに複数のチャットルームを同時に保持できるようになりました。
ChatGPTには、当初からこれらの機能が備わっており、一つのチャットルーム内では補足的な質問の文脈を理解し、適切な回答をすることが可能でした。
例えばこれは、「他にもありますか?」という質問から、「北海道の観光地を他にも知りたい」という意図を汲み取って回答しています。以前の会話を記憶しているため、追加で回答を求めたり、条件を絞り込むこともできます。
ただし、個別のチャットルーム内でのコンテキストの持続性(指示や命令をどれほど覚えているか)は、ChatGPTの方が精度が高いように感じられます。
設計・用途の違い
ChatGPTは、主にChatGPTのアーキテクチャは、人間が書いた文章に近いより自然なテキストを生成すること、及び、文脈を理解し適切な応答を生成する能力に特化しているといえます。自然言語処理のタスクで優れており、テキストベースのコンテンツの処理と生成、例えば言語翻訳、要約、質問応答など、さまざまな言語関連タスクを得意としています。
一方、Geminiのアーキテクチャはマルチモーダル機能を組み込んでおり、テキスト、画像、オーディオなどさまざまなデータタイプの理解と生成を可能にしています。
発展的な用途の具体例
Gemini(旧Bard)
エンターテイメント
- 新しいアイデアの生成
- 物語、詩、脚本、楽曲、ジョーク、手紙の生成
- 言語翻訳
教育
- 数学の特定の概念に苦戦している生徒向けた一連の練習問題の生成
- 生徒の取組についてフィードバックを提供し、追加の支援が必要な領域を特定
- 生徒に合わせた個別の学習計画を作成
仕事
- 会社の販売実績に関するレポートの作成
- レポートの調査結果に関するプレゼンテーションの作成
- 会社の製品やサービスを宣伝するためのマーケティング資料の作成
- 電子メールの作成
ChatGPT
教育
- あらゆる年齢の学生のための教育コンテンツ
- さまざまなトピックに関する質問に答える
- 複雑な概念の説明
- 詩、コード、スクリプト、楽曲、電子メール、手紙などのテキストコンテンツの生成
仕事
- 顧客サービスの向上、潜在顧客の獲得
- 顧客の質問への回答、サポート全般、課題解決
- 潜在的な顧客の特定
- 販売ページや電子メール、キャンペーンなどのマーケティング資料の作成
情報の鮮度の違い
Gemini(旧Bard)は、Google検索を介して現実世界の情報にアクセスして処理し、検索結果と一貫した応答を保つことができます。そのため、情報の鮮度は常に最新の状態に保たれています。
一方、ChatGPTは、2021年以降の最新の情報に対応していない場合があります。実際に、最新情報を必要とする質問をすると、「私の知識は2021年X月までのものなので答えられない」という旨の回答が返ってくることがあります。
2023年3月14日に発表されたGPT-4について、ChatGPTは回答してくれませんでした。
公式サイトのFAQでは、以下のような内容が確認できました。
ChatGPT はインターネットに接続されていないため、不正確な応答が生成される場合があります。2021年以降の世界や出来事についての知識は限られており、場合によっては有害な指示や偏ったコンテンツを生成する可能性もあります。
What is ChatGPT? | OpenAI Help Center
モデルからの応答が正確かどうかを確認することをお勧めします。答えが間違っている場合は、「低評価」ボタンを使用してフィードバックを提供してください。
最新バージョンでは、2022年〜2023年の出来事や最新情報を元に回答するケースも増えてきているとのこと。また有料版ではインターネット接続の設定も可能なので、最新情報を元に回答を生成することができます。
情報ソースの引用の違い
Gemini(旧Bard)は、既存のコンテンツの複製を行わず、オリジナルのものを生成することを前提とし、Webページから情報の引用を行います。複数のページで同じコンテンツが見つかった場合は、人気の高いページを選んで情報を引用します。そして、回答に特定のページのコンテンツが一定以上含まれている場合は、そのページを出典として示します。このようにして、回答の情報源を詳細に提示する機能は、Gemini(旧Bard)特有のものといえます。
ただし、現在は試験運用中のため一部対応していない場合があります。実際に使用したところ、日本語入力では未対応、英語での入力では精度高くソースリンクを得られたものの、アクセス不能なリンクも提示されました。
英語で「Gemini(旧Bard)が2023年にリリースされたという情報のソースとなるリンクを教えて(Please provide me with link to the source of the information that Gemini(旧Bard) was released in 2023)」と入力すると、3つ目の回答で有効なリンクが提示されました。
Googleのページ翻訳機能を使えば英語での回答もスムーズに理解できます。また、リンクのみならず、該当するページ内の文章を引用して回答していることがわかります。
引用:https://blog.google/technology/ai/google-Gemini(旧Bard)-updates-io-2023/
実際にリンクされたページがこちら。Googleによる2023年5月10日の記事で、Gemini(旧Bard)の機能や今後の展開について書かれていました。
さらに、回答の中に画像が表示される場合は、それをクリックするだけで、各画像元のページに直接移動できます。この機能は現在、英語にのみ対応しているようです。
「子犬の画像を表示して」と入力したところ、関連画像が数枚表示されました。画像をクリックするだけで、該当するWebページに移動できます。
一方でChatGPTは、正確に情報を引用できず、さらには回答の情報源を表示できないということが一部で批判的に評価されてきました。ChatGPTは2021年までのデータセットを使用したトレーニングによって、大量のテキストデータを学習しています。
ただし、先ほどの説明の通りインターネットに接続されていないため、最新情報に十分対応できず、正確な情報源を引用できません。実際にOpenAIは、「ハルシネーション(幻覚)」※、最近の出来事の把握、許可を得た上での独自の情報ソースへのアクセスなどが課題であることを明示しています。
2023年5月、ZDNETが、ChatGPTに回答のURLソースを提示させるという検証を行いました。結果は、情報ソースとして提示されたリンクのうち、半分以上がアクセス不能でした。さらに、アクセス可能なリンクのうち、25%以上は回答とは無関係な内容のものでした。
連携の違い
ChatGPTは、他のアプリケーションとシームレスに行き来するような、一貫した操作性があるとは言えません。
一方でGemini(旧Bard)は、GmailやGoogleドキュメントなどの他のアプリケーションと簡単に連携できます。
最新情報によれば、2023年6月7日には、Gemini(旧Bard) が生成したテーブルを、Google スプレッドシートに直接エクスポートできるようになっています。これと同様に、Googleの様々なアプリケーションと連携し、よりスムーズな操作が可能になると考えられます。
右下の「Googleスプレッドシートにエクスポート」をクリック。
スプレッドシートが作成されました。
BardとChatGPTを使う時の注意点
両方に共通する注意点をご紹介します。
情報の信憑性
BardやChatGPTは大規模なデータセットから学習されたモデルですが、それによって生成される情報は必ずしも正確とは限りません。特に医療や法律などの専門的なトピックや最新の情報については、モデルが得たデータの範囲内での情報提供となるため、確認済みの情報源や専門家の意見を参考にすることが重要です。
個人情報は入力しない
BardやChatGPTはオンライン上で利用可能なサービスなので、絶対に個人情報や企業等の機密事項を入力しないでください。これは、モデルが入力された情報を保持したり、悪意のある第三者に漏洩する可能性があるためです。個人情報の取り扱いには慎重になり、必要な場合は安全な方法で個人情報を処理するべきです。
専門的なアドバイスや診断は不可能
BardやChatGPTは一般的な情報提供を目的としており、専門的なアドバイスや診断、法的な助言などは提供できません。専門的なトピックに関する具体的な助言が必要な場合は、専門家の意見を求めるか、関連する専門的なサービスを利用することをおすすめします。
バイアスに注意
BardやChatGPTは、学習データとして使用された大量のテキスト情報に基づいています。そのため、学習データに潜んでいたバイアス(偏見)が反映される可能性があります。例えば、性別、人種、国籍などに関連するステレオタイプや偏見が現れる場合があります。これにより、不正確な情報や偏った意見が提供される可能性があるため、情報を利用する際には多角的な視点を持つことが重要です。
個人に都合の良い回答に偏る場合がある
BardやChatGPTは、ユーザーからの入力や文脈に基づいて応答を生成しますが、それによって個人に都合の良い回答や好意的な応答に偏ることがあります。モデルは、学習データ内の一貫性やパターンを追求する傾向があり、その結果、客観的な情報や反対意見を欠く可能性があります。適切な判断や意思決定を行う際には、異なる情報源や意見を総合的に考慮することが重要です。
まとめ
BardとChatGPTを比較してきましたが、いかがでしたでしょうか?現時点では、回答の速度や精度、Bardは人を楽しませるクリエイティブなコンテンツの生成、ChatGPTはより汎用的で、人間に近い会話や文章の生成を得意としています。ただし、どちらのモデルも注意点を念頭に置いて利用する必要があります。日々新たな改良が進められているので、今後も注目していきましょう。
ChatGPT×AUTOROでできること
- テンプレートを使って自然な文章をRPAで作成する
- ChatGPTにRPAを動かすプログラミングコードを書かせる
- 長い文章の要約、ポイントの抽出
詳細についてはこちら
【お知らせ】AUTOROの新機能 “ChatWithGPT” アクションをリリースいたします
Web Auto Robotの「AUTORO」で業務自動化
AUTOROの製品紹介資料を無料でダウンロードいただけます。
製品の特徴や導入のメリット、ご活用事例などをご紹介しています。
※ハルシネーション(幻覚)
入力された情報に基づいて生成された回答や文章が、実際の事実や正確な情報とは異なること。生成された情報が現実と一致しないという不正確さを表現するための比喩的な表現として使用される。