ChatGPTの登場を受け、1週間仕事を休んでChatGPTを触ってみることにしました。ここでは、1週間の成果として、ChatGPTで具体的にどのようなことができるか、ChatGPTの活かし方をまとめます。
ChatGPTで何ができるか
対話する
まずは年間売上100億円の事業を企画するためのタスクを作成してもらいました。それっぽい。

次にお店向けのChatGPTを活用した新規事業を具体的に提案してもらいます。普通にありそう・・すげえな。

ついでに新規事業を役員に提案するメールを書いてもらいました。自分よりちゃんとしてる。

最後に新規事業企画の苦労と喜びを詩にしてもらいました。器用だ。

要約する
次に要約です。Webページの要約はWebPilotプラグインを使います。パッと概要をつかみたいときに使えそうです。要約したのはDjango3入門: 初心者でも10分でWebサービスを作れる!PythonフレームワークDjangoとPaizaCloudの使い方。

次にPDFの要約です。AskYourPDFプラグインでネットで拾ってきた研究論文のPDFを読み込みます。さらにサマリをSpeechkiプラグインを使って音声にしました。原子スイッチング現象とは・・・

最後の要約はYoutubeです。Video Insightsプラグインを使って、大好きなSteve Jobsの動画をまとめました。そして、Show Me Diagramsプラグインでグラフ化します。メッセージ部分が大切なのに、エピソードの具体的な内容をまとめていてちょっと微妙でした。ここら辺のニュアンスを読み取るところまではまだ難しいのでしょう。


要約は概して完成度が高く、ざっと内容を掴むには十分でした。通話内容などの要約にも使えそうです。
スライドを作成する
次はスライド作成です。https://gamma.appを使いました。「ChatGPTの紹介」と書くと、各ページのタイトルを提案してくれて、承認するとスライド作成が始まり10分ぐらいで完成です。出来たスライドがこちら。

内容は大分怪しいですが、スライドとしての形にはなってます。完成度高い。ワードやコンフルでメモを作成して、ワンクリックするだけでプレゼンのスライドが作成できる未来は近いでしょう。
音楽・動画・画像を作成する
次にクリエイティブ系です。今回、画像生成に一番感動したのですが、長くなりそうなので最後に説明します。まずは音楽です。Meta(Facebook)が公開した「MusicGen」というオープンソースを利用します。作成したのは「坂本龍一を参考に、悲しみの中に前向きさを感じるJポップ」です。まずはChatGPTでプロンプトを作成しました。そして、作成された音楽が以下になります。意外とそれっぽい感じではないでしょうか。

次にこの曲に合わせた動画を作成してみましょう。まずは、ChatGPTで同じくプロンプト作成です。動画作成にはRunwayというサービスを使いました。完成した動画を先ほどの音楽を再生しながら見てみてください。なんとなく雰囲気は合ってますね。まだ画質が粗いですが、ソフトウェアとハードウェアの進化でいずれ改善するのでしょう。

最後に画像生成です。まずはStable Diffusionで作成した画像から紹介します。このクオリティ凄くないですか。アニメ風のものからフォト風のものまで各種モデルがあり、さまざまな画像を作成することができます。CIVITAIにモデルや作成した画像が掲載されていますので、どのような画像が生成できるか興味ある方はご覧ください。


画像生成のために参考にした資料を並べておきます。Google Colab環境でStable Diffusion WebUIを動かしました。今回はテキストから画像を生成したのですが、キャラクターを固定して画像を生成することも可能です。テキストから生成する場合に重要になるのはやはりプロンプト(呪文)。変な手を生成しないようにするためのNegative promptなど、試行錯誤の余地がありそうです。なお、先ほど紹介したCIVITAIでは生成した画像だけではなくそのプロンプトも確認できます。
- 簡単に Stable Diffusion のモデルを試せる Google Colab の使い方ガイド (Ver2)
- Stable Diffusionのフォトリアル系モデルを紹介
- StableDiffusionのアニメ調モデルを紹介
- 【Stable Diffusion】リアル系モデルをよりリアルにする方法【BRA編】
- Stable Diffusionで画像から画像を生成する方法
- Stable Diffusionで使える呪文集(プロンプト集)
一方、生成した画像を利用する際にはライセンスを気をつける必要があります。結構複雑でまだ理解できていないのですが、参考になるリンクを残しておきます。商用利用する際にはここがハードルです。
- 【画像生成AI】Stable Diffusion派生モデルを利用・公開するときはライセンスに注意しましょう
- 【モデル制作者さんに伝えたいこと】 Basil mix と、 Dreamlike のライセンスについて
プログラミング
最後にプログラミングです。まずは自動AI「AutoGPT」です。何が凄いかって、目的を与えるだけで、どのタスクが必要かを考え、Web検索を含めて実行し(ここではWebでオセロのルールを確認して)、プログラミングを作成し、テストするところまで自動でやってくれます。ここではオセロゲームをPythonで作成してみることにします。

結果は・・・バグにはまってオセロゲームは完成しませんでしたw。Youtubeでは、無事にオセロゲームが完成したケースも報告されています。今はまだ、ちょっとおバカだったりもして時間かかりますが、いずれ解決するのでしょう。何をやるかだけを決めて寝て、起きたらAutoGPTがコードを完成させている未来は近そうです。

なお、AutoGPTは、Python、Visual Studio Code、gitの他、GoogleのCustom Search APIを使うので設定は大変です。自分はAutoGPTを徹底解剖!使い方をご紹介!【2023年4月25日最新版】を参考にしました。
こちらは自分では実行していないのですが、ChatGPTに相談しながらPythonコーディングしていくものや、データ分析をするものです。完全自動はまだ無理だとしても、サポート役としては優秀なので、ChatGPTをコーチとして使いながら、プログラミングやデータ分析を学ぶ、効率的に実施するという使い方は今でも有効だと思いました。
同じくサポート役というツールとしてはGithub Copilotがあります。これは今後使ってみたいと思ってます。ただ、ここでも著作権の問題が発生しているようですね。GitHubのコードを機械学習に利用していいのか、Copilotが生成したプログラムに著作権はあるかなど。著作権に詳しくないのでよく分かっていないのですが、genAI(CahtGPTなどの生成AI)によって著作権法には大きな変化が訪れるのでしょうか。
ChatGPTをどのように使うか
さて、ここまで見てきたCahtGPTでできることを踏まえて、ChatGPTの活用法をまとめていきます。折角なので、まずはChatGPTにまとめてもらいました。

ChatGPTの活用法
ふむふむという感じですが、個人的には、ChatGPTは言語を理解している(ように見える)、言い換えると非構造化データを高いレベルで操作できているという点が大きいと感じています。それによって生成が可能になりましたし、言葉だけではなくグラフ・音・画像にも対応できています。
また、インターフェースとしては、質問ないしは指示を理解し回答することができるので、自然な対話を可能にしました。コンピュータが人間と同等の知能を持つかどうかを評価するための試験としてチューリングテストというものがありますが、もはや人間かChatGPTかを判断することは難しいでしょう。
そのChatGPTをどのように活かしていくかですが、人間にしかできなかったことでAIにもできることが広がり、HowをChatGPTに委ね、人はWhatを考えることに集中するという活かし方になるのでしょう。HowをChatGPTに頼ることでこれまで人がやっていた作業を効率化することができます。また、ChatGPTはWeb上の知識を利用することができるので、その点では多くの人を知識の上では上回るはずで、ChatGPTの理解が微妙だとしても、膨大な知識を利用することで、頭脳労働や学習を高度化することもできるでしょう。
| ジャンル | 活用例 |
|---|---|
| 作業を効率化する | ・メール、スライド、議事録の作成 ・プログラミングのサポートまたは自動生成 ・音楽・動画・画像を作成(場合によっては人のモデルが不要に) |
| 頭脳労働や学習を高度化する | ・大量の知識から必要な箇所を抜粋または要約 ・人がレビューする前に、観点の抜け漏れがないかを確認 ・プログラミングや英語のコーチとして利用 |
| より具体的な業務活用例 | ・電話内容から特徴量を作成し、クライアントごとに最適化したメールを配信 ・チャット形式でカスタマーのお店探しをサポート(検索行動が不要に) ・コンテンツの原案を音楽・動画・画像付きで自動生成 ・過去の国会答弁を作成に、答弁案を作成 ・法律改正案の作成(法律の書き方にはルールがありプログラミングに近い) |
ChatGPTにできないこと(人の価値)
最後に、ChatGPTにできないこと(人の価値が残る部分)は何でしょうか。まずは、先ほども少し触れましたが、ChatGPTが何かを生成するとしても、What(≒プロンプト)を入力するのは人なので、Whatが人の頑張るポイントです。ただ、AutoGPTのように目的を入力したら、それ以降のタスクを含めて自動生成される未来を考えると、人が関与するWhatの範囲は狭くなっていきそうです。
次に、ChatGPTは過去のデータを使用し、アルゴリズムによって結果を出力します。このため、過去のデータがない検討は難しいでしょうし、機械的に答えを出せない問いに回答することも難しいでしょう。裏返すと、他に例のない新規のチャレンジや情緒的な問いが人の出番です。ただ、こちらも、ある企業や業種にとっては新規だとしても、他の企業や業種で事例がある場合にはChatGPTにとっては新規ではないでしょうし、情緒的な問いだとしてもそこに一定のパターンがあればChatGPTでそれっぽい回答を出せるはずなので、こちらも人の出番は減っていく方向に思えます
そして、人の心を動かせるのは人だけなのではという点です。ChatGPTで適切な事業計画を作成できたとして、それを信じて実行しようとする気になれるでしょうか。ChatGPTに愚痴をいって、スッキリするでしょうか。人が語るからこそ共感できるという側面があるはずで、人ではないChatGPTが原理的に代替できない部分だとすると、見立てる/仕立てる/動かすの中で、動かすの部分、つまり人とコミュニケーションを取る部分が人の主たる役割になるのかもしれません。ただ、この点についても、チューリングテストでもはや人かChatGPTかを判別できないとすると、この点さえもいずれ部分的には乗り越えてくるのかもしれません。
こうして書いていくと人の役割はどんどん狭くなる方向だと感じてしまいます。実際に人でやっていたことをChatGPTに置き換える事例が出てきているし今後もたくさん出てくるとは思うのですが、それで人の仕事がなくなるかでいうと、まだまだやるべきことがあるので、特に心配する必要はなく、パソコン登場時がそうであったようにHowが進化して、Whatを考える人間がより忙しくなるだけというのが短期的な影響になりそうです。おしまい。

コメント