AI、Web3 領域の転職、副業をお探しなら詳しくはこちら

DALL·E 2とは?使い方・料金・使いこなすコツを徹底解説!Midjourney・Stable Diffusionとの違いとは?

DALL·E 2とは?使い方・料金・使いこなすコツを徹底解説!Midjourney・Stable Diffusionとの違いとは?

近年の飛躍的な技術進歩により、生成AIによって文章や画像、音声までもが制作できるようになりました。

DALL·E 2は、ChatGPTでテキスト生成AIの世界を大幅に飛躍させたOpenAI社が開発する画像生成AIです。特別なコーディングスキルは必要なく、普段私たちが使っている言葉を入力するだけで、その内容に沿った画像を生成します。

本記事では、DALL·E 2の特徴や使い方、利用時の注意点などを解説します。さらに、DALL·E 2と並んで人気のある画像生成AIであるMidjourney、Stable Diffusionを比較します。2023年9月に発表された後継モデルDALL·E 3についても最新情報を紹介していますので、画像生成のいまが分かる記事になっています。

Tech Forwardに登録されているAI分野の最新求人一覧を以下からご覧ください。

目次

DALL·E 2とは?

DALL·E 2とは?

DALL·E 2とは、OpenAIが提供する、自然言語(テキスト)から画像を作り出す画像生成AIです。DALL·E 2は「ダリ・ツー」と読み、名前の由来はスペインの画家であるサルバドール・ダリと、映画WALL・E(ウォーリー)から来ています。

これまでAIは、データを「識別」する目的で用いられていました。しかし生成AIは、業務効率化だけでなくクリエイティブな創作活動もできるため、DXに出遅れた企業が一気に後れを取り戻す手段として期待されています。

例えば、イラスト作成時のアイデア出しや、SNSの添付画像作成などにも活用可能です。使い方さえ覚えてしまえば、誰もが高品質な画像をすぐに生成できるようになるため、イラストを多く利用する会社や部署にいる方は大幅な業務効率化が図れるでしょう。

DALL·E 2の後継モデルDALL·E 3とは?

DALL·E 2の後継モデルDALL·E 3とは?

OpenAIは、2023年9月にDALL·E 2のバージョンアップ版である「DALL·E 3」を10月に公開すると発表しました。従来のDALL·E 2よりもニュアンスやディテールをより深く理解することが出来るため、ユーザーのアイデアを高精度に画像変換することが可能です。

DALL·E 3はChatGPTと統合した画像生成AIであり、高い言語処理能力を持っています。そのため、ChatGPTを使う要領で画像生成ができ、複雑なプロンプトにも正確に対応できるようです。言葉のニュアンスやディテールをより繊細に捉え、プロンプトに基づき直感的に画像生成をすることが可能です。期待していた生成物とは異なる画像が生成されても、ChatGPTにその旨を伝えるだけで簡単に微調整できます。

引き続き、DALL·E 3で生成される画像は商用利用も可能です。また、既存のアーティストのスタイルを模倣するリクエストの拒否や、自身の作品をAIのトレーニングから除外する「オプトアウト」機能も提供されています。さらに、暴力的・憎悪的な内容や公人をモチーフにした画像生成を制限するセーフガードが導入されています。

こちらの記事でDALL·E 3で大きく進歩されたポイントについて詳しく解説していますので併せてご覧ください。

DALL·E 2とMidjourney、Stable Diffusionの比較

DALL·E 2とMidjourney、Stable Diffusionの比較

DALL·E 2と並んで人気のある画像生成AIであるMidjourney、Stable Diffusionを比較します。

こちらの記事でMidMidjourneyの仕組み、使い方について詳しく解説していますので併せてご覧ください。Stable Diffusionの仕組み、使い方はこちらをご覧ください。

強み

モデル名強み説明
DALL·E 2使いやすさインターフェースがシンプルで、第三者プラットフォームにサインアップすることなく利用できる点が評価されています。AIや画像生成に不慣れなユーザーにとって、導入障壁が低いと言えます。
Midjourney高品質な画像生成抽象的な絵や異世界のビジョンを高度に反映できる能力があります。これは、特にクリエイティブなプロジェクトや高度なビジュアル表現が必要な場合に非常に有用です。
Stable Diffusionコストパフォーマンス無料で利用可能で利用回数に制限がないにもかかわらず多機能のため、コストパフォーマンスに優れています。スタートアップ企業や個人開発者にとって、費用対効果が高い選択肢となります。

機能面での違い

モデル名機能面の特徴
DALL·E 2生成した画像を編集したり、バリエーション展開したりできる。また、第三者プラットフォームにサインアップすることなく画像生成が可能です。
Midjourney抽象的な絵を生成し、異世界のビジョンを細部まで反映できる。Discordアカウントが必要です。
Stable Diffusionテキストベースで入出力でき、画像の生成枚数や利用制限がない。Negative Promptという機能があり、全体的な画像品質を高めることができます。

料金面での違い

モデル名料金面の特徴
DALL·E 2基本的に有料のクレジットが必要。
Midjourney月額プランがあり、年間契約で20%の割引が適用されます。プランによって、GPU使用時間が異なります。
Stable Diffusion無料で利用可能で、利用回数に制限はありません。

画像の特徴

モデル名画像面の特徴
DALL·E 2OpenAIが開発した画像生成AIで、シンプルなインターフェースを持ちます。
Midjourney高品質で抽象的な絵を生成でき、ユーザーがプログラムでカスタム比率を設定できます。
Stable Diffusion異世界感の画像を生成するのが得意です。

Tech Forwardに登録されているAI分野の最新求人一覧を以下からご覧ください。

DALL·E 2の3つの特徴

DALL·E 2の3つの特徴
ホログラムはCGと写真の混合です。

DALL·E 2の特徴は以下の3つです。

  • 一度に4枚の画像を生成
  • 基本的に有料
  • 商用利用可能

それぞれについて解説します。

一度に4枚の画像を生成

DALL·E 2では、一つの文章に対して4枚の画像を生成できます。多くの画像生成AIは、一つの文章に対して1枚の画像しか出力されないため、思い通りの画像が生成されなければ再度文章を入力する必要があります。

それに対してDALL·E 2は、一度に4枚の画像を生成できるため、思い通りの画像に出会える確率が4倍になります。これにより、画像生成にかかる時間を短縮できるため、加工や修正にかける時間を増やすことができ、より高品質な画像を作れるようになります。

基本的に有料

DALL·E 2は、基本的に有料です。料金は、115クレジットで15米ドル(約2200円)に設定されています。1クレジットあたり約20円、1枚当たり約5円です。

ただし、2023年4月6日以前に登録したユーザーであれば、登録時の50クレジットに加えて、毎月15クレジットが付与されます。

商用利用可能

出典:OpenAI「DALL·E 2」

DALL·E 2で生成した画像は、商用利用が可能です。

Can I sell images I create with DALL·E?
Subject to the Content Policy and Terms, you own the images you create with DALL·E, including the right to reprint, sell, and merchandise – regardless of whether an image was generated through a free or paid credit.

DALL-Eで作成した画像を販売することはできますか?

コンテンツポリシーと規約に従い、無料または有料のクレジットを使用して作成された画像に関わらず、DALL-Eを使用して作成された画像は、転載、販売、商品化の権利を含め、お客様の所有となります。

出典:OpenAI「Can I sell images I create with DALL·E?」(太字は編集者が追加)

商用利用する際は、画像右下にあるレインボーのクレジット表記を残すようにしましょう。これを消し、AIが生成したことを隠す行為はポリシー違反になるため、注意が必要です。

DALL·E 2でできること

DALL·E 2では、以下のことが可能です。

  • Text to Image(言語から画像の生成)
  • Generation Variations(類似画像の生成)
  • Inpainting(対象物の置換)
  • Outpainting(画面外の画像生成)

それぞれについて解説します。

Text to Image(言語から画像の生成)

Text to Imageは、自然言語(私たちが普段使う言葉)を入力することで、画像を生成する機能です。

DALL·E 2は、画像生成AIによく用いられている「拡散モデル」を用いて画像を生成します。拡散モデルを用いると、同じプロンプト(指示文)を入力しても、高確率で異なる結果が出力されるため、気に入った画像が生成されたらその場で保存しましょう。

Generation Variations(類似画像の生成)

DALL·E 2は、一つのテキストに対して4枚の画像を生成できます。その中から一番理想的なものを選び、加工、修正します。

理想の画像が生成されなかった場合は、プロンプトを見直して画像を生成し直しましょう。

Inpainting(対象物の置換)

Inpaintingでは、対象物を指定した人やモノに置換できます。例えば、テーブルに座るサルの画像に「税金を払うサル」と指定すると、以下のようになります。

パソコンが出現し、サルが税金の処理をしている画像になりました。さらに、「monkey wearing a funny hat(おかしな帽子を被ったサル)」と指定すると、以下のようになります。

このようにDALL·E 2では、生成した画像に加工することが可能です。

Outpainting(画面外の画像生成)

出典:OpenAI「Introducing outpainting」

Outpaintingでは、画面の外にはみ出した領域をAIが予測し、付け足してくれます。例えば、フェルメールの「真珠の耳飾りの少女」をOutpaintingすると、以下のようになります。

DALL·E 2の使い方

DALL·E 2の使い方について以下ステップで説明します。

  1. 公式ページにアクセスする
  2. ログインまたは登録をする
  3. プロンプトを入力する

公式ページにアクセスする

まず、DALL·E 2の公式ホームページにアクセスします。

出典:OpenAI「DALL·E 2」

右上の「Get started」からログイン画面に移動します。

ログインまたは登録をする

OpenAIのアカウントを持っている方は「Log in」からログインすると、以下のようにOpenAIのサービスを選択できるようになります。アカウントを持っていなければアカウントを作成しましょう。

ここでは「DALL-E」を選択します。

プロンプトを入力する

画面中央のスペースにプロンプトを入力し「Generate」を選択すると画像が生成されます。

初めはクレジットがありませんので、試したい方は「Buy Credit」から購入しましょう。

DALL·E 2を使いこなす3つのコツ

DALL·E 2を使いこなす3つのコツ

DALL·E 2を使いこなすためのコツは以下です。

  • プロンプトは英語で入力する
  • 条件を細かく指定する
  • 画像内に文字を入れない

プロンプトは英語で入力する

プロンプトを英語で入力すると、精度高く画像を生成できます。英語が不得意な方も、翻訳サイトを活用するなどして、極力英語で入力すると良いでしょう。

英語で入力すると精度が上がる理由は、日本語の学習データよりも英語の学習データの方が多いからです。DALL·E 2に限らず、多くのAIは英語のデータで学習するため、基本的に生成AIへは英語で指示したほうが精度が高くなる傾向にあります。

Tech Forwardの姉妹サービスであるPrompt Plusは、プロンプトエンジニアの作成した高品質なプロンプトを売買可能なプロンプトマーケットプレイスです。プロンプトの販売や購入にご興味のある方はぜひご覧ください。
プロンプトマーケットプレイス|Prompt Plus

条件を細かく指定する

条件を細かく指定することで、思い通りの画像により近づけることができます。例えば、「散歩している夫婦」であれば、「公園を散歩する日本人の夫婦、写真」のように細かく指定しましょう。

日本人が想像する夫婦は、多くの場合日本人の夫婦ですが、AIには先入観がないため人種はランダムに選ばれます。そのため、登場人物の人種や服の色、画像の雰囲気など、条件が決まっていれば文字に起こして指定するようにしましょう。

画像内に文字を入れない

画像内に会社名や店名などの文字を入れたい場合は、画像生成後に手動で入れると良いでしょう。

DALL·E 2は「〇〇という文字を入れてください」という指示は読み取れますが、文字の一部分が抜けてしまったり、順番がばらばらになったりしてしまいます。できるだけ文字の指定はせずに、ご自身で入れるようにしましょう。

DALL·E 2使用時の注意点

DALL·E 2使用時の注意点

DALL·E 2を利用する際には、以下の点に注意する必要があります。

  • 著作権を侵害しないようにする
  • 全て自身で制作したと表現しないようにする
  • 画像サイズを変更できない

著作権を侵害しないようにする

通常、DALL·E 2で生成した画像を利用しても著作権侵害には当たりませんが、既存の画像から新しく画像を生成するi2i(イメージtoイメージ)を利用する際には注意が必要です。

赤枠の「upload an image」では、既存の画像を元に画像生成・加工が可能です。しかし、i2iは元の画像の影響を強く受けるため、元の画像の著作権を侵害してしまう可能性があります。

基本的に、DALL·E 2などのAIが生成した画像の著作権は、人が制作した画像の著作権と同様に扱われます。AIに関する著作権は文化庁の「AIと著作権」で解説されています。生成画像を公開・商用利用する予定のある方は一度確認すると良いでしょう。

全て自身で制作したと表現しないようにする

DALL·E 2で生成した画像は、全て自分自身で制作したと誤解させないようにしましょう。

DALL·E 2で画像を生成すると、右下にレインボーのクレジットが付与されます。それを削除すること自体は問題ありませんが、人の手で作られた作品であると誤解させるような表現をしてはいけません。

You may remove the DALL·E signature if you wish, but you may not mislead others about the nature of the work. For example, you may not tell people that the work was entirely human generated or that the work is an unaltered photograph of a real event.

DALL·Eの署名(レインボーのクレジット)は削除しても良いですが、それによって作品の本質を誤解させてはなりません。例えば、作品の全てが人の手によって作られたものであるとか、実際の出来事を撮影したものだと伝えることは禁止です。

引用:OpenAI「Content policy」(太字は編集者が追加)

表現が難しい場合は、クレジットを残すようにしてみてください。

画像サイズを変更できない

DALL·E 2の画像サイズは1024px×1024pxで固定されています。画像サイズを変えたい場合は、生成後に加工する必要があります。

Stable DiffusionやMidjourneyのように、画像サイズやアスペクト比を変更できる画像生成AIもあります。スクエア以外の画像を生成したい方は他の画像生成AIの利用を検討してみてください。

DALL·E 2でよくある質問まとめ

DALL·E 2とは

DALL·E 2はOpenAIによって開発された画像生成AIです。特別なコーディングスキルは不要で、自然言語を入力するだけで関連する画像を生成できます。

DALL·E 2と他の画像生成AI(Midjourney、Stable Diffusion)との主な違いは?

DALL·E 2は使いやすさで優れており、特にAIや画像生成に不慣れなユーザーにとって導入が容易です。Midjourneyは高品質な画像生成が可能で、Stable Diffusionはコストパフォーマンスに優れています。

DALL·E 2を使いこなすためのコツは?

DALL·E 2を効果的に使用するためには、プロンプト(指示文)を英語で入力すること、条件を細かく指定すること、そして画像内に文字を手動で入れることが推奨されています。

まとめ

本記事では、DALL·E 2の特徴や使い方、利用時の注意点などを解説しました。

DALL·E 2は、高品質な画像を数秒で生成可能です。これにより、イラスト外注の手間が省けたり、今まで文章だけだったSNS投稿に関連画像を付けられたりと、様々な業務の効率化・省力化が図れます。

しかし、DALL·E 2で高品質な画像を生成するには、適切なプロンプトを入力するスキルが必要です。「プロンプトエンジニア」という職業ができるほど、プロンプトの入力スキルは重要視されています。

業務で活用する機会がありそうなら、今のうちからプロンプトを学習してみてはいかがでしょうか。

プロンプトエンジニアについては「プロンプトエンジニアとは?なぜ人気?仕事内容・年収と必要なスキル・将来性を詳しく解説!」で紹介しているので、興味のある方は参考にしてみてください。

Tech Forwardに登録されているAI分野の最新求人一覧を以下からご覧ください。

Tech Forward公式Discordには、AI・Web3・メタバースなど先端テクノロジーに興味のある方が集まっています。最新テクノロジー情報のキャッチアップや、同じ興味分野がある方との人脈づくり最新技術活用の議論お仕事情報GETが可能です。ぜひ気軽にTech Forward公式Discordにご参加ください!

DALL·E 2とは?使い方・料金・使いこなすコツを徹底解説!Midjourney・Stable Diffusionとの違いとは?

この記事が気に入ったら
フォローしてね!

シェアお願いいたします
目次