-
文章から絵を生み出した最初の衝撃|DALL·E
「アボカドの形をした安楽椅子」——そんな実在しないものまで、文章で指示するだけで AI が描いてみせる。2021 年の DALL·E は、言葉から画像を生み出す時代の幕を開けた、記念碑的な研究です。やさしく解説します。
-
100種類の言語を“丸ごと”聞き取るAI|音声認識のWhisper
ノイズが多くても、なまりが強くても、外国語でも——驚くほど正確に聞き取る音声認識 AI。2022 年の Whisper は、ウェブから集めた 68 万時間もの音声で学び、追加調整なしで多言語の文字起こしと翻訳をこなします。やさしく解説します。
-
言葉と画像を同じ地図に並べたAI|画像生成を支えるCLIP
「猫の写真」という言葉と、実際の猫の画像。AI にとって本来はまったくの別物でした。2021 年の CLIP は、4 億組の画像と説明文から両者を“同じ地図”の上に並べ、今の画像生成 AI を支える土台になりました。やさしく解説します。