Googleは2024年2月、AIチャットサービス「Bard」を大幅にアップデートし、「Genemi」として新たに提供開始しました。Genemiは、Bardの機能をさらに強化し、より自然な会話と高度な機能を実現しています。
今回は、生まれ変わったGoogleのAIチャット、Geminiの基本的な使い方とできることを改めてご紹介します。進化を続けるGoogleのAIチャットで現状何ができるのか、気になる方は必見です!
Geminiはチャットツール以外でも利用できます。詳しくは下記記事をご参照ください。
目次
Google Gemini(旧Bard)とは?
Google Gemini(旧Bard)は、Googleが2023年3月に公開したチャット型AI「Bard」からブランド変更し、大幅なアップデートが行われた最新のAIチャットツールです。チャットで質問などを送信すると、AI が自然かつ正確な回答を出力してくれます。
Googleが2021年に公開した言語生成 AI「LaMDA(ラムダ)」というLLM(大規模言語モデル)を利用して開発されました。
発表されて以降、続々と新機能が追加されています。2023年7月にはChatGPT等の他社AIツールに先駆けて、画像入力(マルチモーダル※)に対応するなど注目を集めました。
※「マルチモーダル」とは、テキスト、音声、画像、動画などのうち複数の情報の形式を組み合わせて利用することを指します。例えば、音声と画像を一緒に使って物体を認識するシステムや、テキストと画像を組み合わせてキャプションを作るシステムなどが例として挙げられます。反対に、テキストのみ、画像のみといった一つの情報のみを処理する場合は「シングルモーダル」と呼びます。
機能面では、3つの回答案を同時に表示できるほか、インターネットに接続され、最新情報に対応して回答でき、さらにはGoogleの他のツールとシームレスに連携できる点が特徴的です。
同じくGoogleが提供している、生成AI搭載の新たな検索体験「SGE」については下記記事をご参照ください。
Google Gemini(旧Bard)との違いについても解説しています。
Google Gemini(旧Bard)とChatGPTの違い
Gemini(旧Bard)とChatGPTはどちらも優れた対話型AIですが、機能面で異なる点が多く見受けられます。
Google Gemini(旧Bard) | ChatGPT(無料版) | ChatGPT Plus(有料版) | |
料金 | 完全無料 | 無料 | 月20ドル |
回答の情報元 | インターネット上の情報をもとに回答 | 学習データをもとに回答 | 学習データをもとに回答、インターネット接続も可能 |
最新情報 | インターネット上の最新情報に対応 | 2021年9月までの情報に対応 | 2023年までの情報、インターネット上の最新情報に対応 |
リンクの提示 | 回答の引用元となるリンクを示せる | × | 回答の引用元となるリンクを示せる |
回答の数 | 1つの質問に対し回答3つ | 1つの質問に対し回答1つ | 1つの質問に対し回答1つ |
連携 | Googleの他ツールとシームレスに連携 | × | × |
会話の共有 | Gemini(旧Bard)との会話をリンクで共有し、他のユーザーはそ共有された会話を途中から続けられる | × | × |
画像入力 | ◯ | × | ◯ |
音声入力 | ◯ | ⚪️(モバイル版のみ) | ◯(モバイル版のみ) |
回答の音声読み上げ | ◯ | × | × |
ワンクリックで回答を書き換える機能 | ◯ | × | × |
画像を含む回答 | 回答にインターネット上の画像を引用し示る | 回答に画像は使用しない | 画像生成が可能 |
URLの読み込み | URLを読み込んで、サイトの要約ができる | × | URLを読み込んで、サイトの要約ができる |
まず、Gemini(旧Bard)は完全無料のサービスであることに対し、ChatGPTは有料(月額20ドル)で使える最新モデルがあります。ChatGPT無料版は、無制限で利用できますが、最新モデルに比べて、回答の精度や機能が制限されます。
さらに、Gemini(旧Bard)がインターネットに接続されており、最新情報に対応しているのに対し、ChatGPT(無料版)は接続されておらず、2021年9月頃までのデータにしか対応していないということなどが挙げられます。
最近になって2023年ごろの最新情報に対応したという情報もありますが、ChatGPTは回答の情報元やソースリンクを示すことができないので、この辺りははっきりとしていません。一方で、Gemini(旧Bard)はインターネット上の引用元を表示できます。
また基本的な機能の違いとしては、ChatGPTは一つの質問に対し1つの回答を生成するのに対し、Gemini(旧Bard)は同時に3つの回答を生成し、最も適切なものをユーザー自身で選ぶことができます。
またGemini(旧Bard)は、GoogleスプレッドシートやGmailなどGoogleの様々なツールとシームレスに連携します。ChatGPTには当然そのような機能はなく、多様なツールを包括的に提供するGoogleならではの強みと言えるのではないでしょうか?
Google Gemini(旧Bard)の始め方
- (持ってない方は)Googleアカウントを作成
- Gemini[https://gemini.google.com/app ]にアクセスする
- 右上の「ログイン」を選択する
- 個人のGoogleアカウントでログインする
チャットの画面が開けたら完了です。
Google Gemini(旧Bard)の基本的な使い方
Gemini(旧Bard)の使い方をご説明します。
Gemini(旧Bard)にアクセスします。
「ここにメッセージを入力してください」の入力フォームに質問や指示を入力し、送信して完了です。
続けて、その他基本的な機能についてご紹介します。
Google Gemini(旧Bard)の基本機能10つ
基本機能を画像付きでご紹介します。
①新たなチャットルームを作成する
新たにチャットルームを作成します。それまでのチャットは履歴として残ります。
②送信したテキストプロンプトを書き直す
送信済みのテキストを書き直して、回答を生成し直します。
③他の回答案(3つ)を表示する
Gemini(旧Bard)では同時に3つの回答案が表示されますワンクリックで再度回答を生成できます。
④回答を自動音声で読み上げる
自動音声が回答を読み上げます。
英語や日本語のほか40以上の言語に対応しています。
⑤テキストを送信する
入力したテキストを送信します。
⑥テキストを音声で入力する
マイク許可を完了すると、音声でテキストを入力できます。キーボードを打って入力する必要がなくなります。
⑦画像入力
画像をアップロードして質問を送信できます。
⑧回答をコピーする
クリックするだけで回答をコピーし、共有できます。自分で選択してコピーする手間が省けます。
⑨回答の書き換え、共有、回答の検索
回答のワンクリックの書き換え、共有とエクスポート、回答の検索(チェック)ができます。それぞれについて説明します。
回答のワンクリックの書き換え | 回答のスタイルや、回答の長さををワンクリックで変更できます。 | |
共有とエクスポート | [共有] | 選択した1つのメッセージと回答またはチャット全体を公開リンクを作成し、共有できる。 |
[Googleドキュメントにエクスポート] | 回答をもとに、自動でGoogleドキュメントが作成される。 | |
[Gmailで下書きを作成] | 回答をもとに、自動でGmailの下書きが作成される。 | |
回答を再確認(チェック) | 回答の正確性を、自動で検索して再確認できます。 関連トピックの検索もワンクリックで可能です。 |
⑩チャットの固定と名前変更
特定のチャットルームを上部に固定したり、チャットルームの名前を変更できます。チャットの削除もここから行えます。
特定のチャットルームを上部に固定したり、チャットルームの名前を変更できます。チャットの削除もここから行えます。
Google Gemini(旧Bard)の最新機能8つ
基本機能に追加されたGoogle Gemini(旧Bard)の最新機能を7つご紹介します。
- Google Gemini(旧Bard)がマルチモーダル化
- 回答の表現を一瞬で書き換える
- Google検索から画像を表示させる
- ReplitにPythonコードをエクスポート
- 高度な計算やデータ分析のためのコード実行
- Gemini(旧Bard)が作ったテーブルをGoogleスプレッドシートにエクスポート
- 会話を他のユーザーと共有し継続する
- Gemini(旧Bard) Extensions(拡張機能)の登場
続いてそれぞれ詳しく解説します。
Google Gemini(旧Bard)がマルチモーダル化
2023年7月13日、Gemini(旧Bard)に『Google Lens』が実装され、入力フォームでテキストの入力に加え、画像を使用できるようになりました。例えば、スクリーンショットや自分で撮影した写真をアップし、「この写真について説明して」と送信すると、Gemini(旧Bard)が画像とテキストを読み取って回答します。
ユーザーからは、ChatGPTを追い越してGemini(旧Bard)にこの機能が実装されたことに驚く声も上がっていました。
情報に若干ブレが出る場合もありますが、画像の説明や、グラフや表の説明、計算問題などに対応しています。
かなり雑に書かれた手書きのメモも読み込めるとのことで、今後も新たな活用法の発見が期待されています。
回答の表現を一瞬で書き換える
回答をよりシンプルにしたり、長くしたり、短くしたり、専門的な表現にしたり、くだけた表現にしたりと、回答の表現の変更が簡単にできるようになりました。
以上のように5つのオプションが追加されています。本来ならプロンプトで「もっとカジュアルに書き換えて」と入力し指示しなければなりませんが、その必要がなくなり、より効率的にコンテンツ生成が可能になります。
Google検索から画像を表示させる
Gemini(旧Bard)は、インターネット上の画像を用いて回答を生成することができます。加えて、画像の引用元をリンクで示すため、ワンクリックで該当するページにアクセスできます。テキストに「画像を用いて」と指示することも可能です。
「初めてのソロキャンプに何を持っていけばいい?画像を用いて教えてください。」と送ったところこのように生成されました。画像の精度は完璧とは言えませんが、20種類ほどの道具とその画像を即座に表示しました。情報収集を格段に効率化できそうです。
※回答が2つ並んで表示されるのは、フィードバックを送信する新しい方法が追加されたためです。希望する回答案を選択でき、何も指定しない、またはこの機能を完全にオフにすることも可能です。
ReplitにPythonコードをエクスポート
Google Colabに加え、ReplitにもGemini(旧Bard)で生成したPythonコードをエクスポートできます。これにより、プログラミングタスクをシームレスに継続することができます。
コードを生成した場合のみ、「共有とエクスポート」から「Replitにエクスポート」が選択できるようになります。
高度な計算やデータ分析のためのコード実行
Gemini(旧Bard)は、計算に関するメッセージを検知し、バックグラウンドでコードを実行する能力が向上しています。そのため、数学的なタスクやコーディングに関する質問に対する回答がより正確になり、文字列の操作もより適切に行えます。
Gemini(旧Bard)が作ったテーブルをGoogleスプレッドシートにエクスポート
Gemini(旧Bard)が生成した表を、Googleスプレッドシートにエクスポートできます。表は、回答の際に勝手に生成されることもありますし、プロンプトで「こんな表を作成してください」と条件を提示して作成を依頼することもできます。
回答で示された表の「Googleスプレッドシートにエスクポートする」をクリックすると、自動でスプレッドシートが作成されます。
タイトルも自動的に付与され、スプレッドシートに自動保存されます。
会話を他のユーザーと共有し継続する
ユーザーがGemini(旧Bard)との会話を公開リンクで共有でき、さらに他のユーザーがその会話をそのまま続けたり、新しい質問を追加したりできるようになりました。
これは、他のユーザーのアイデアを参考にしたり、自分自身のアイデアを他のユーザーと共有したりしやすくなるという効果があります。
「共有とエクスポート」から共有できます。
Gemini(旧Bard) Extensions(拡張機能)の登場
現在は英語版のみの対応ですが、Google Gemini(旧Bard)に拡張機能「Gemini(旧Bard) Extensions」が登場しました。
Gemini(旧Bard) Extensionsは、Gemini(旧Bard)との会話やコラボレーションを新しい方法で可能にするもので、複数のGoogleツールにまたがる情報を、自動で検索し、関連付けて表示できるようにします。
具体的には、Gmail、Googleドキュメント、Googleドライブ、Googleマップ、YouTubeなどのツールに対応しており、従来よりさらに拡大した連携が可能になります。
例えば、沖縄旅行の計画を立てる場合、Gemini(旧Bard)に頼んでGmailから都合の良い日付を検索し、リアルタイムのフライトやホテル情報を把握し、Googleマップで道順を確認し、YouTubeで旅行先の情報を視聴することができます。
また、仕事の応募に関連して、Gemini(旧Bard)を使用してGoogleドライブから指定の履歴書を検索し、それを要約して新しいカバーレターの下書きを自動で作成することもできるようになるようです。
参考:Google Japan Blog: Gemini(旧Bard) が高性能なモデルにアップデート
Google Gemini(旧Bard)の発展的な使い方10選(上級者向け)
ここからは、Google Gemini(旧Bard)の機能を最大活用する方法10選をご紹介します。
- ビジネスメールを作成
- 文章の要約と翻訳
- 特定のWebサイト(URL)の要約と翻訳
- 最近の出来事を要約してもらう
- 文章の校正と校閲
- 問題を作成・添削
- コード生成とアプリケーション開発
- データ分析
- アイデアのブレーンストーミング
- 画像を読み取って分析・検索
それぞれ見ていきます。
ビジネスメールを作成
Gemini(旧Bard)は、Gmailと連携できますし、実際にメールの下書きを作成する能力にも優れています。
「商品の問い合わせのメール」「お礼メール」「打ち合わせの日程について」など、様々な場面を指定して作成できます。また口調や長さなども詳細に指示できます。
文章の要約と翻訳
生成AIはテキストベースのタスクに汎用的に対応可能です。そのため長い文章を読み込んで要約したり、翻訳したりもできます。
文章を入力して要約・翻訳する手順は、最初に「以下の文章を要約(翻訳)してください。」と入力し、その下に対象となる文章を貼り付けるだけ。長さや、箇条書きや表の作成、書き方の指定も合わせて指定するとより精度が高まります。
特定のWebサイト(URL)の要約と翻訳
Gemini(旧Bard)は、インターネット上の情報を引用して回答を生成します。つまり、インターネット上の複数の情報に自動でアクセスできるということです。
この特徴を活かして、Webサイトの要約と翻訳ができます。
手順は、最初に「以下のサイトを要約(翻訳)してください。」と入力し、その下に任意のURLを貼り付ければOKです。
これにより自分でサイトを隅々まで見なくても概要をすぐに理解できるようになります。「重要な部分を教えて」「意見を除いて事実だけ抽出して」など細かく条件を指定したり、回答後に続けて質問をしたりなども可能です。
これは、製品の公式サイトの読み比べや、英語で書かれたニュース記事を読む時などに非常に便利です。
最近の出来事を要約してもらう
「最近の世界情勢について教えて」「今の日本の政治状況は?」などといった漠然とした質問は、インターネット上の情報を網羅するGemini(旧Bard)だからこそ回答できます。
ただし、回答の引用元のリンクを表示する機能は、日本語版ではまだ不安定です。心配であれば、Googleアカウントの言語設定を英語にしてから、Gemini(旧Bard)を使ってみてください。
Googleアカウントの言語設定を英語にする手順
【Googleアカウント】→「個人情報」→「ウェブ向けの全般設定」→「言語」から、言語設定を「English」(英語)に変更
文章の校正と校閲
自分が書いた文章の誤字・脱字の発見や修正をGemini(旧Bard)に依頼できます。「文章がおかしい部分がないか調べて欲しい」「誤字・脱字を修正して欲しい」「矛盾点があれば指摘してほしい」など、人に依頼するようにプロンプトと任意の文章を合わせて送信すれば、Gemini(旧Bard)が文章をチェックしてくれます。
英作文の採点など、外国語の学習にも活用できそうです。
もちろん、最後は自分の目で本当に合っているのかを確認しましょう。
問題を作成・添削
外国語や資格取得に向けて勉強し始めたなら、Gemini(旧Bard)に問題の作成と添削をお願いしましょう。
TOEICや文法問題、単語の問題など思いつくものをGemini(旧Bard)に提案してみましょう。
またこれは、学習のみならず、指導する方にとっても有用な使い方です。問題の作成や添削を効率化し、より効果的な教育が可能になるかもしれません。
コード生成とアプリケーション開発
Gemini(旧Bard)はコードの生成のみならず、文章も同時に生成できます。そのため、コーディングとその解説、検証など様々なプロセスをGemini(旧Bard)に依頼、またはGemini(旧Bard)と協働し進められます。
これを活用してアプリケーション開発も容易に行えるようになります。
Gemini(旧Bard)でコード生成を行う手順は以下の通りです。
- Gemini(旧Bard)に、コードを生成したい言語と、生成したいコードの種類を指定
- Gemini(旧Bard)が指定された条件を満たすコードを生成
アプリケーションの開発を行う手順は以下の通りです。
- Gemini(旧Bard)に、アプリケーションの要件を指定
- Gemini(旧Bard)が、要件を満たすアプリケーションの設計図を作成
- ユーザーが設計図をもとに、アプリケーションを開発
データ分析
データ分析も生成AIの得意分野です。対象となるデータを入力して送信して、解析を依頼できます。ただしCSVデータを読み込めないのが少々難点です。
アイデアのブレーンストーミング
Gemini(旧Bard)は、クリエイティブに優れた生成AIであり、アイデア出しやイメージを具体化する作業との相性が非常に良いといえます。
曖昧なテーマを送信すると、次に何を考えれば良いのかのヒントが得られます。全くの白紙から新たなアイデアを思いつくことも重要ですが、Gemini(旧Bard)はその一歩目のサポートをしてくれると考えると良いでしょう。
先にご紹介した、Webサイトの要約と併用して、Webサイトの情報を元にしたブログ投稿のアイデアを生成することもできます。
画像を読み取って分析・検索
Gemini(旧Bard)は画像入力が可能です。読み込んだ画像を元に、その説明をしたり、表を作成したり、またコードやHTMLの生成をしたりなども可能です。精度はまだブレがあるようですが、今後のアップデートに期待したいところです。
まとめ
今回は、Googleが提供するGoogle Gemini(旧Bard)について、概要から基本的な使い方、発展的な活用方法、またChatGPTとの違いなどについて詳しくご紹介しました。
Google Gemini(旧Bard)は、日々新たな機能が追加されています。今後の動きにも注目しつつ、今回ご紹介した使い方を参考にしてGoogle Gemini(旧Bard)を活用してみてはいかがでしょうか?
生成AIについての詳しい資料はこちら
生成AIについて独自にまとめた資料を無料でダウンロードいただけます。
2023年の生成AIトレンドから2024年のAI動向予想まで、活用例を含めてご紹介しています。
Google Gemini(旧Bard)のよくある質問
Google Gemini(旧Bard)は無料で使える?
Google Gemini(旧Bard)は完全無料で利用できます。
Google Gemini(旧Bard)は誰でも使える?
Google Gemini(旧Bard)は、Google個人アカウントまたは、管理者が許可したGoogle Workspaceアカウントがあれば、誰でも利用できます。アカウント未作成の方はこちらからアカウントを作成してください。
Google Gemini(旧Bard)はどうやって使う?
Google Gemini(旧Bard)は、 PCやスマホなどブラウザ上でどこからでも利用できます。
Andoroid版のみ専用のアプリがあり、iOS版はアプリ「Google」で提供開始予定です。
Google Gemini(旧Bard)は日本語に対応してる?
Google Gemini(旧Bard)は一部機能を除き、日本語に対応しています。
ただし、英語で入力した方が出力の精度が高くなるのは、他の生成AIと同様です。
Google Gemini(旧Bard)は何ができる?
Google Gemini(旧Bard)では主に、以下のようなことが可能です。
- 一度に複数の回答
- 画像・音声入力
- 回答の自動音声読み上げ
- インターネット上の最新情報に基づいて回答
- 画像を用いて回答
- GmailやGoogleドキュメントなどと連携
- アイデアの生成
加えて、Gemini(旧Bard)はコーディングや、メールの文章作成、文章の要約など様々な場面で活用できます。
今後もさらに機能が追加される可能性があります。
Google Gemini(旧Bard)はインターネットに接続されてる?
Google Gemini(旧Bard)はインターネットの情報をもとに回答を生成する機能です。出典元を示して回答を出力します。
Gemini(旧Bard)の画像入力の手順
(「この画像について説明して」「この問題を解いて」など)
画像を読み取って、質問に適切に回答します。