タグ

OpenAIに関するo_hiroyukiのブックマーク (4)

  • GPTベースの翻訳アプリOpenAI Translatorの使用感|shu223

    正直もうDeepLより圧倒的にGPTの方が翻訳精度良いね・・・時代の変化が速すぎてDeepL開発チームに同情するレベル。 — Ulara 🇯🇵🇺🇸東京シアトル2拠点生活中 (@ularatter) February 14, 2024 なんとなくそういう気はしてたが、DeepLの⌘C×2で翻訳が走る体験がしっくり来すぎていて翻訳に関してはDeepLを使い続けていた。 いやしかしよく考えたら、利用し続けている理由がショートカットだけなら、OpenAI APIをたたくそういう(ショートカット指定できる)翻訳アプリをつくればいいのでは?というかそういうのもうOSSで出てるのでは? と思って探してみたらやっぱりあった。 https://github.com/openai-translator/openai-translator スター数19.9k。既に相当有名なようだ。 インストール方法Re

    GPTベースの翻訳アプリOpenAI Translatorの使用感|shu223
  • 【AI動画生成】Sora 要素技術解説

    もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと

    【AI動画生成】Sora 要素技術解説
  • Sora: Creating video from text

    Sora Creating video from text Sora is an AI model that can create realistic and imaginative scenes from text instructions. Read technical report We’re teaching AI to understand and simulate the physical world in motion, with the goal of training models that help people solve problems that require real-world interaction. Introducing Sora, our text-to-video model. Sora can generate videos up to a mi

    Sora: Creating video from text
  • AI Webcam - ゆーすけべー日記

    AI Webcamについて紹介します。 AI Webcam AI WebcamはWebcamでとった写真についてAIが音声で返答してくれるというものです。AIのキャラクターというか音声は指定可能です。また文章のプロンプトでどのように返答するかも指定できます。 例えば、アメリカの若い女性「レイチェル」に自分の容姿を褒めてもらった時の大爆笑映像はこちらです。 元ネタ 実は元ネタがあって、Wes Bosというポドキャスターがやってたのを真似てます。コードも公開されているので、それを使わせてもらってます。みなさんもできます。 YAPCでLT あまりにも面白いので、先日のYAPC::HiroshimaのLTでこれを応用したものをデモしました。レイチェルだけを流しても尺が余るしインパクトにかけるので、YAPCっぽく「dankogai」さんと「papix」をAIにしました。 UIはこんな感じです。 例え

    AI Webcam - ゆーすけべー日記
  • 1