AI、Web3 領域の転職、副業をお探しなら詳しくはこちら

DALL·E 3とは?ChatGPTでの使い方は?2との違い・商用利用の可否を解説!

DALL·E 3とは?ChatGPTでの使い方は?2との違い・商用利用の可否を解説!

ChatGPTの登場により、生成AIという言葉が世の中に浸透しました。生成AIはテキストだけではなく、画像の生成においてもビジネスシーンで威力を発揮しています。

OpenAIは2023年9月、画像生成AIであるDALL·E 2の次期版「DALL·E 3」を公開しました。DALL·E 3は、言語処理能力が向上しており、利用者の指示に忠実な画像を生成できるようになっています。

本記事のアイキャッチ画像(冒頭の画像)もDALL·E 3で生成しました。

DALL·E 3は無料で体験することが可能です。無料で利用する方法や、商用利用の可否を知りたい方も多いのではないでしょうか。

本記事では、DALL·E 3の概要やDALL·E 2との違い、無料で利用する方法を解説します。仕事の幅を広げて市場価値を上げたいエンジニアはもちろん、一度試しに使ってみたいと考えている方も本記事を参考に画像生成AIを試してみてください。

目次

DALL·E 3とは

DALL·E 3

DALL·E 3は、2023年9月20日(現地時間)にChatGPTの運営元OpenAIが公開した画像生成AIです。DALL·E 2の次期版として登場しました。自然言語(テキスト)の情報を基に画像を生成できます。

DALL·E 3は「ダリ・スリー」と読みます。スペインの画家であるサルバドール・ダリと、映画WALL・E(ウォーリー)が名前の由来となっています。2023年11月現在、BingやChatGPT内で利用可能です。

DALL·E 2に比べて格段にテキスト理解能力が向上

DALL·E 3との大きな違いは、私たちが打ち込む自然言語(テキスト)を理解する能力が向上している点です。実際に、DALL·E 3を制作したOpenAIも以下のように述べています。

DALL·E 3 understands significantly more nuance and detail than our previous systems, allowing you to easily translate your ideas into exceptionally accurate images.DALL-E 3は、従来のシステム(DALL·E 2)よりもニュアンスやディテールを理解し、あなたのアイデアを的確な画像に変換します。

出典:ダリ3「OpenAI」

テキストを理解する能力が向上したため、意図した画像を正確に生成できるようになりました。実際、DALL·E 2とDALL·E 3の出力結果は、以下のような違いが出ます。左がDALL·E 2、右がDALL·E 3です。

出典:DALL·E 3「OpenAI」

どちらも、「An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.(星雲の爆発のように描かれた、バスケットボール選手のダンクを表現した油絵)」と指示した結果です。

DALL·E 2の方は、腕や手、ゴールリングの形がいびつです。そもそも、ダンクしている様には見えません。一方、DALL·E 3の方は、特別不自然な点はなく、指示通りの画像になっています。

このように、DALL·E 3はDALL·E 2に比べて、与えられたテキスト情報を忠実に画像に再現する能力が高くなっています。

こちらの記事でDALL·E 2の仕組み、特徴について詳しく解説していますので併せてご覧ください。

DALL·E 3で見逃せない5つの特徴

DALL·E 3で見逃せない5つの特徴

DALL·E 3の特徴として、以下が挙げられます。

  • ChatGPTとの統合
  • 画像の微調整が可能
  • ニュアンスを理解できる
  • 無料で体験できる
  • 著作権・安全性への配慮

それぞれについて解説します。

ChatGPTとの統合

DALL·E 3は、その最先端の機能性を更に拡張するために、ChatGPTとシームレスに統合されています。この統合により、ChatGPTはDALL·E 3の使用をより直感的かつ効果的なものに変えています。

2023年11月現在、有料版のChatGPTでDALL·E 3が利用できます。微調整にも対応してくれますので、有料会員の方はぜひ利用してみてください。

ChatGPTは、ユーザーのアイデアや要望をより精密なプロンプトに変換する役割を担います。これにより、DALL·E 3はユーザーの意図により忠実に従い、高品質で具体的な画像を生成します。

この統合の利点は多岐にわたります。まず、ChatGPTは自然言語処理を活用して、複雑なアイデアや抽象的な概念を理解し、それをDALL·E 3が解釈しやすい形式に変換します。

ユーザーは、簡単な文から詳細な段落まで、あらゆる形式の指示をChatGPTに提供でき、それに基づいてChatGPTはDALL·E 3に適したプロンプトを自動生成します。

画像の微調整が可能

DALL·E 3では、画像の微調整が可能な機能が提供されています。もし。生成された画像が完璧でない場合、ユーザーはわずかな指示でChatGPTに調整を依頼でき、DALL·E 3がそれに応じて画像を微調整します。

ユーザーがアイデアを提示すると、ChatGPTがDALL·E 3のためにそのアイデアを具現化するための特別に調整された詳細なプロンプトを自動生成できます。

例えば、ユーザーが「緑豊かな森の中の静かな湖」というアイデアを提案した場合、ChatGPTはこのアイデアを具体化するための詳細なプロンプトを生成します。DALL·E 3はそのプロンプトに基づいて画像を生成します。

しかし、もしユーザーが湖の色をより青くしたい、または森の木々をもっと密集させたい場合、これらの具体的な要望をChatGPTに伝えることで、DALL·E 3はそれに応じて画像を微調整します。これにより、ユーザーはDALL·E 3に、より具体的で洗練された指示を提供することができます。

ニュアンスを理解できる

DALL·E 3は自然言語を処理する能力が向上しています。そのため、DALL·E 2や他の画像生成AIよりも、文章のニュアンスをより正確に理解できます。

従来の画像生成AIと比較して、DALL·E 3は、入力されたテキストの意図をより深く理解し、それに基づいて画像を生成します。多くの画像生成ツールは単語や説明を無視する傾向がありますが、DALL·E 3は提供されたテキストに忠実に従う能力が特に高くなっています。

この進化は、詳細な画像キャプションを使用した学習プロセスによって実現されました。これにより、DALL·E 3は単に画像を生成するだけでなく、テキスト通りのビジュアル表現を創り出すことが可能となりました。より高度なレベルでテキストのニュアンスを理解することができます。

この機能は、テキストから画像への変換を求める際に、より正確で豊かなビジュアルコンテンツを求めるユーザーにとって大きな利点となります。

無料で体験できる

DALL·E 3は、Bingの「チャット」から無料で利用することも可能です。前モデルであるDALL·E 2は、限られた人しか無料で利用できませんでした。無料でOpenAIの画像生成AIを利用できるのは、非常に大きなメリットと言えるでしょう。

DALL·E 3がBingで利用できる理由は、OpenAIとMicrosoftの関係性にあります。OpenAIは、Bingの運営元であるMicrosoftから、百億ドル以上の投資を受けています。このような背景があり、MicrosoftのサービスでDALL·E 3が利用できるのです。

著作権・安全性への配慮

DALL·E 3は、安全性と著作権の尊重に重点を置いて設計されています。まず、暴力的、成人向け、または憎悪に満ちたコンテンツの生成を制限するための措置が講じられています。

このため、公共の人物の名前に基づくリクエストや、プロパガンダやデマに関連するリスク分野での生成要求は拒否されます。さらに、ドメインの専門家と協力して、モデルをストレステストし、安全性の向上を図っています。

また、DALL·E 3は、生存するアーティストのスタイルでの画像リクエストを拒否するように設計されています。これにより、現存するアーティストの創作的な独自性が尊重されます。

加えて、クリエーターは自分の画像をDALL·Eの将来の画像生成モデルの訓練からオプトアウトする選択肢も持っています。これらの措置は、AIによる画像生成の倫理的側面と著作権の保護を重視しています。

DALL·E 3の使い方

DALL·E 3は2023年11月現在、2つの方法で利用できます。

  • 【無料】Bingで使う
  • 【有料】ChatGPTで使う

無料で利用したい方はBingで、ChatGPTの有料会員の方はどちらかで試してみてください。

【無料】Bingで使う

まず、Bingを開きます。Googleやsafariでも、「Bing」と検索すればBingの検索エンジンを利用できます。

Bingを開けたら、以下画像のように赤枠の「チャット」を開きましょう。

Bingを開けたら、以下画像のように赤枠の「チャット」を開きましょう。

すると、以下の画面が出てきます。指示文は、以下画像赤枠の「何でも聞いてください…」に入力します。

指示文は、以下画像赤枠の「何でも聞いてください…」に入力

試しに「猫が小魚を咥えているイラストを制作してください」と入力してみます。

試しに「猫が小魚を咥えているイラストを制作してください」と入力

このように、画像を生成できます。

画像を生成

気に入った画像をクリックすると、上のような画面に移ります。ここで、共有やダウンロードが可能です。

【有料】ChatGPTで使う

まず、ChatGPTを開きます。

ChatGPTを開きます。

以下画像のチャットウインドウ内に指示文を入力します。試しに、「猫が小魚を咥えている写真を制作してください」と入力します。

生成作業が始まります。

以下のように、画像を生成できます。画像を右クリックしてダウンロード可能です。

以下のように、画像を生成できます。画像を右クリックしてダウンロード可能です。

DALL·E 3を使いこなす4つのコツ

DALL·E 3を使いこなすには、いくつかのコツがあります。

  • プロンプトを活用する
  • パラメータを操作する
  • 英語で指示する
  • 画像識別子(seed)を活用する

それぞれについて解説します。

プロンプトを活用する

DALL·E 3へ指示する際に、プロンプト(呪文)を活用すれば、イメージ通りの画像により近づけることができます。例えば、以下のようなプロンプトがあります。

高品質にmasterpiece,best quality
写真風にPhotorealistic
スケッチ風にsketch
アニメ風にanime

例えば、以下のように利用します。

指示文:A cat is holding a small fish in its mouth,Photorealistic
(訳:小魚を咥えている猫、写真風に)

優れた画像を生成できる指示文(プロンプト)は、販売することもできます。

Tech Forwardの姉妹サービスであるPrompt Plusは、プロンプトエンジニアの作成した高品質なプロンプトを売買可能なプロンプトマーケットプレイスです。プロンプトの販売や購入にご興味のある方はぜひご覧ください。
プロンプトマーケットプレイス|Prompt Plus

このように、優秀なプロンプトは高い価値を生み出します。今では、プロンプトを作り出す「プロンプトエンジニア」という職業まであります。

こちらの記事でプロンプトエンジニア仕事内容、将来性、年収相場について詳しく解説していますので併せてご覧ください。

パラメータを操作する

DALL·E 3では、画像生成に使用される様々なパラメータを微調整することができます。これにより、ユーザーは画像のスタイルや品質を自由に変更し、望むビジュアル効果を得ることが可能です。以下は、DALL·E 3で利用できる主要なパラメータです:

  1. スタイル:例えば、「natural」または「vivid」の2種類のスタイルがあります。vividスタイルでは、より超現実的でドラマチックな画像を生成します。一方、naturalスタイルでは、より自然な画像が生成されます​​。
  2. 品質:standard、またはhdの品質を選択できます。hd品質では、より細かなディテールと画像全体の一貫性が高い画像が生成されます​​。
  3. サイズ:1024px x 1024px、1792px x 1024px、1024px x 1792pxの3つの異なる画像サイズを選択できます。これにより、アスペクト比の柔軟性が高まり、生成される画像のスタイルやコンテキストに大きな影響を与えることができます​​。

これらのパラメータを調整することで、ユーザーはより多様なイメージを生成し、特定のアートスタイルや視覚的効果を求める場合に特に有効です。DALL·E 3は、これらの設定を調整することで、超現実的なスタイルからサイケデリックなスタイルまで、幅広いビジュアルスタイルの実験を可能にします。

英語で指示する

英語が世界共通言語であることと、開発元のOpenAIがアメリカにあることから、DALL·E 3は英語の学習データが最も多いと言われています。

画像生成AIは、学習データが多いほど精度が高くなる傾向にあります。よって、日本語で指示するより、英語で指示する方が適切な画像を得られるかもしれません。

英語が苦手な方は、Google翻訳を使ったり、ChatGPTで翻訳したりすることで英語の指示文を得られます。

画像識別子(seed)を活用する

DALL·E 3において、各生成画像が持っているseed識別子の活用は画像生成のカスタマイズにおいて重要な役割を果たします。seedを指定することで、同じ入力に対して毎回同じ結果を生成するようになります。

seedの取得は簡単で、上記画像のように「seedください」と指示すれば提供されます。

seedを使用することで、元の画像に望む要素を追加し、微調整を行うことも可能になります。つまり、特定のseedを設定することで、同じプロンプトに対して一貫した画像を得ることができます​​​​。

例えば、既存の子供の画像のseedを指定して、肩にオウムを乗せるような細かな変更も、このseedを用いることで容易に実施できます。

また、異なる年代で同じ人物を一貫して描写することも可能です。seedを一定に保ちつつ、年齢パラメータのみを変更することで、異なる人生段階での同一人物の一連の画像を生成できます。また、特定のキャラクターに対して、姿勢、表情、服装などが異なる画像を生成可能です。

これにより、物語性の高いビジュアルストーリーテリングや、キャラクターの一貫性を維持することが可能になります。

DALL·E 3の生成画像は商用利用できる?

BingでDALL·E 3を利用した場合、商用利用できません。その理由や、商用利用するためにはどうすれば良いのかを解説します。

Bingで生成した画像は商用利用できない

Bingで生成した画像は、商用利用できません。

Subject to your compliance with this Agreement, the Microsoft サービス規約, and our Content Policy, you may use Creations outside of the Online Services for any legal personal, non-commercial purpose.

マイクロソフトのサービス規約、およびマイクロソフトのコンテンツ ポリシーを遵守することを条件として、合法的な個人的、非商業的な目的であれば、オンラインサービス外で創作物を使用することができます。

出典:Bing「Bing スレッド エクスペリエンスおよび Image Creator に関する規約」

Bingは、創作物の商用利用を許可していません。Bingで生成した画像は、商用利用しないようにしてください。

ChatGPTで生成した画像は商用利用できる

ChatGPTのDALL·E 3で生成した画像は、商用利用可能です。

Can I sell images I create with DALL·E?

Subject to the Content Policy and Terms, you own the images you create with DALL·E, including the right to reprint, sell, and merchandise – regardless of whether an image was generated through a free or paid credit.

出典:OpenAI「Can I sell images I create with DALL·E?」

ChatGPTでDALL·E 3を利用するには有料会員になる必要がありますが、商用利用する際にはChatGPTから画像を生成するようにしてください。

DALL·E 3利用時の注意点

DALL·E 3利用時の注意点

DALL·E 3の利用時には、以下の点に注意してください。

  • 著作権を侵害しないようにする
  • AIが制作したことを明記する

それぞれについて解説します。

著作権を侵害しないようにする

基本的には、DALL·E 3で生成した画像を使用しても著作権を侵害することはありません。しかし、既存の画像から画像を生成するi2i(image to image)を利用すると著作権を侵害するリスクが高まります。

以下の2つを満たすと、著作権侵害と認められる可能性があります。

「後発の作品が既存の著作物と同一、又は類似していること」(類似性)

「既存の著作物に依拠して複製等がされたこと」(依拠性)

出典:AIと著作権「文化庁」

i2iの使い方によっては、2つ目の「著作権に依拠して複製する」行為だと捉えられます。また、i2iは元の画像に大きく影響を受けるため、類似してしまう可能性が高いでしょう。

このように、i2iの利用は著作権を侵害するリスクがあります。i2iでは、著作権フリー画像や、ご自身で描いたイラストを利用するようにしてください。

AIが制作したことを明記する

OpenAIは、DALL·E 3で生成した画像は、AIが制作したものだとわかるようにすることを求めています。「全て自分で制作した」などの嘘はつかないようにしましょう。

また、実際の出来事と誤解させるような利用も禁じています。DALL·E 3で制作した画像を利用する際は、AIが生成したことがわかるように工夫しましょう。

DALL·E 3でよくある質問まとめ

DALL·E 3とは?

DALL·E 3は、2023年9月20日(現地時間)にChatGPTの運営元OpenAIが公開した画像生成AIです。DALL·E 2の次期版として登場しました。自然言語(テキスト)の情報を基に画像を生成できます。

DALL·E 3は「ダリ・スリー」と読みます。スペインの画家であるサルバドール・ダリと、映画WALL・E(ウォーリー)が名前の由来となっています。2023年11月現在、BingやChatGPT内で利用可能です。

DALL·E 3の特徴は?
  1. ChatGPTとの統合
  2. 画像の微調整が可能
  3. ニュアンスを理解できる
  4. 無料で体験できる
  5. 著作権・安全性への配慮
DALL·E 3のseedとは?

DALL·E 3において、各生成画像が持っている識別子がseedです。seedを指定することで、同じ入力に対して毎回同じ結果を生成するようになります。

seedの取得は簡単で、「seedください」と指示すれば提供されます。

seedを使用することで、元の画像に望む要素を追加し、微調整を行うことも可能になります。つまり、特定のseedを設定することで、同じプロンプトに対して一貫した画像を得ることができます​​​​。

まとめ

本記事では、DALL·E 3の概要やDALL·E 2との違い、無料で利用する方法を解説しました。

DALL·E 3を活用すれば、画像制作の手間や時間を大幅に削減できます。イラストレーターの方や、業務でイラストや画像を頻繁に利用する方は、一度試してみてはいかがでしょうか。

IoT・AI・ビッグデータなどの技術革新は、第4次産業革命とも呼ばれています。このような流れもあり、DALL·E 3をはじめとする生成AI技術は、飛躍的な進歩を遂げています。IT関連の仕事に就いている方は、急速な技術革新に取り残されないよう、情報収集を欠かさずに行うようにしてみてください。

Tech Forward公式Discordには、AI・Web3・メタバースなど先端テクノロジーに興味のある方が集まっています。最新テクノロジー情報のキャッチアップや、同じ興味分野がある方との人脈づくり最新技術活用の議論お仕事情報GETが可能です。ぜひ気軽にTech Forward公式Discordにご参加ください!

Tech Forwardに登録されているAI・Web3分野の最新求人一覧を以下からご覧ください。

DALL·E 3とは?ChatGPTでの使い方は?2との違い・商用利用の可否を解説!

この記事が気に入ったら
フォローしてね!

シェアお願いいたします
目次