オープンAIが新AIモデル発表 高速
✍️記事要約
(ブルームバーグ): 対話型人工知能(AI)「ChatGPT」を開発した米オープンAIは、GPT-4モデルをアップデートした「GPT-4o(オー、omniの略)」を発表した。スピードアップと低価格を実現したという。
13日のライブ配信イベントで披露された新しい大規模言語モデル(LLM)、GTPー4oは膨大な量のデータをインターネットから取り入れて学習し、リアルタイムでの文字情報や音声、画像の扱いが優れている。数週間内にリリースされる見通し。
システムに話しかければ、わずかミリ秒で音声で返答し、流れるような会話が可能になると、オープンAIは説明。同様にプロンプト(指示・質問)として画像をシステムに見せれば、画像で応答できるという。
オープンAIは新モデルについて、速度は2倍となり、効率も大幅に向上したと説明した。
発表イベントでは、会話の中で一つの言語から他の言語に交互にほぼ即時に通訳する様子なども示された。
ミラ・ムラティ最高技術責任者(CTO)は「相互のやりとりや使いやすさを飛躍的に向上させたのは今回が初めてだ」とブルームバーグ・ニュースに話し、「ChatGPTのようなツールとの共同作業が本当に可能になる」と語った。
今回のアップデートに伴い、質問に対する答えをウェブで探したり、話しかけた上でさまざまな音声で回答を聞いたり、これまで有料ユーザーに限定されていた幾つかの機能が無料で使うことができる。
GPT-4がゴールドスタンダードであり続けるAI界は、急速に進化しているが、今回のリリースはさらに揺さぶりをかけるとみられる。アンソロピックやコヒアなどのスタートアップや、アルファベット傘下のグーグルといった大型ハイテク企業など、AIモデルを世に送り出す企業は増えており、特定のベンチマークではGPT-4に匹敵、あるいは上回る機能があると主張している。
14日にはグーグルが開発者会議を予定している。AI先行組に属するグーグルは、この場でさらなるアップデートを発表すると見込まれ、マイクロソフトが支援するオープンAIとの競争に新たな展開が予想される。
オープンAIのサム・アルトマン最高経営責任者(CEO)はこの日のイベント終了後にソーシャルメディアの「X(旧ツイッター)」に投稿し、「さらなるプロダクトを近く発表する」とコメントした。
■英訳
(Bloomberg): OpenAI, the American company that developed the conversational AI "ChatGPT," has announced an update to the GPT-4 model, called "GPT-4o" (the "o" stands for "omni"). This new model promises increased speed and lower costs.
Revealed at a live streaming event on the 13th, the new large language model (LLM), GPT-4o, has been trained on a vast amount of data from the internet and excels in handling text, voice, and images in real-time. It is expected to be released within a few weeks.
OpenAI explained that the system can respond to spoken input in just milliseconds, enabling smooth conversations. Similarly, if an image is provided as a prompt, the system can respond with an image.
OpenAI noted that the new model is twice as fast and significantly more efficient. During the event, the ability to interpret between different languages almost instantaneously was also demonstrated.
Mira Murati, Chief Technology Officer (CTO) of OpenAI, told Bloomberg News, "This is the first time we've dramatically improved the interactivity and ease of use," adding, "Collaboration with tools like ChatGPT is now truly possible."
With this update, several features previously limited to paid users, such as searching for answers on the web and receiving responses in various voices, will now be available for free.
While the AI world, with GPT-4 as the gold standard, is rapidly evolving, this release is expected to further shake up the landscape. More companies, including startups like Anthropic and Cohere and large tech companies like Alphabet's Google, are releasing AI models, some claiming to match or surpass GPT-4 in specific benchmarks.
On the 14th, Google is scheduled to hold a developer conference. As an AI leader, Google is expected to announce further updates, potentially introducing new developments in its competition with Microsoft-backed OpenAI.
After the event, OpenAI CEO Sam Altman posted on the social media platform "X" (formerly Twitter), stating, "More products will be announced soon."
◇ ◇ ◇
☘️ヤフコメ❗️ピックアップ☘️
ボイスチャットのデモでは、感情を込めた流暢な会話のやりとりを披露しています。ここまで自然になると、電話口などで話している相手が人間なのかAIなのか、そう簡単には分からなくなってくる印象です。
またMac用アプリでは、画面に映っている内容をChatGPTに説明させています。Macを操作するときのアシスタント機能としてさまざまな可能性を感じると同時に、アップルが発表しそうな機能を一足先に実現しようとしているのも面白いところです。
✅ Claude 3 Opusと軽く比較してみた結果、また順位が逆転した感じがします。
弱点だったPDFの読み込みが出来ない(IR資料の分析などが出来ない)、速度が遅い、という弱点がどちらも解消されました。計算も精度が上がっているように思います。
OCRは漢字を多少間違えますが指摘すると正しい値を返すので、これも優秀ですね。
✅ AIを使いこなして、、なんて私には難しい事ですが、一つ言えるのは、海外旅行がより身近になるのかなと。一人だと不安だし、英語や現地の言葉を話せる人が居るだけで、数倍旅行を楽しめる。カメラを通し言葉を翻訳したり、交互にスマホに話しかけ翻訳を待つという事も無くなるのかな。よりスムーズに、より自然に世界を楽しめる時代が来るのかもしれないですね。加えてやり取りが自然になるにつれ、AIが語学の先生になる日もすぐ近くに来ているのかも。