タグ

CPUに関するdenqueueのブックマーク (5)

  • 伝説のCPUアーキテクトJim Keller氏が示すAIの未来

    伝説のCPUアーキテクトJim Keller氏が示すAIの未来
    denqueue
    denqueue 2023/06/21
    "つまりAIプログラム同士が通信する世界、人間とAIが会話する世界である。これが実現して初めてAIアクセラレータはAIプロセッサ、あるいはもっと違う名前で呼ばれるようになるだろう" /一歩先を見据えたビジョンが流石だ
  • VM環境のCPU仮想化はどうやって実現しているのか ハードウェア仮想化支援機構の仕組み

    Arm入門勉強会とは、macOSがArmに移行したこの機にArmアーキテクチャでのプログラミングについて入門するソフトウェアエンジニアのための会です。今回主催の@nullpo_head 氏が、Armの仮想化支援機構について、その仕組みから深く説明します。前半は「現代のハードウェア仮想化支援機構」について。全2回。 ハードウェア仮想化支援とは何か 佐伯 学哉氏:入門セッション3つ目は『Armの仮想化支援機構』についての入門セッションです。どうぞよろしくお願いします。 発表のスタートとゴールです。VMwareとかQemuとか使ったことあるけど仮想マシンの仕組みなんも知らんというところがまずスタートになっています。 1個目のゴールは、最近のVMのざっくりした仕組みとハードウェア仮想化支援とは何かということがわかること。そしてその話のあとに実際にArmの仮想化支援機構の概要を説明し、Armの仮想

    VM環境のCPU仮想化はどうやって実現しているのか ハードウェア仮想化支援機構の仕組み
    denqueue
    denqueue 2021/02/26
    "PopekとGoldbergの仮想化要件として、すべてのセンシティブ命令が特権命令であるようなアーキテクチャは、特別な支援機構がなくても割合高速な仮想化CPUが実現できることが知られています。"
  • 東工大、IoT向けCPUアーキテクチャ「SubRISC+」。エネルギー効率3.8倍

    東工大、IoT向けCPUアーキテクチャ「SubRISC+」。エネルギー効率3.8倍
    denqueue
    denqueue 2021/02/22
    命令数4とは割り切った設計だな。IoTのエッジ処理って実際のところどのような処理が求められるのかしら。
  • QUICむけにAES-GCM実装を最適化した話 (1/2)

    4月末に、会社のほうで「Can QUIC match TCP’s computational efficiency?」というブログエントリを書きました。我々が開発中のQUIC実装であるquiclyのチューニングを通して、QUICのCPU負荷はTLS over TCP並に低減可能であろうと推論した記事です。この記事を書く際には、Stay Homeという状況の中で、手元にあった安いハードウェアを使ったのですが、その後、10gbe NICを入手し、ハードウェアによるUDP GSOオフロード環境でのパフォーマンスを確認していくと、OpenSSLのAES-GCM実装がボトルネックになることがわかってきました。 TCP上で通信するTLSでは、一般に、データを16KB単位でAEADブロックに分割して、AES-GCMを用いてAEAD暗号化します注。一方、UDPを用いるQUICでは、パケット毎にAES-GC

  • ウェハースケールCPUの誕生――Cerebrasのクレイジーな挑戦 | gihyo.jp

    2019年11月、スパコン(スーパーコンピュータ)のトップカンファレンスであるSC19で、小形のAI専用スパコンがデビューをはたしました。「⁠CS-1」と名付けられたそのマシンは、ウェハースケール、つまり30cmシリコンウェハーを一枚まるごと使った巨大なCPUをもち、その広大な領域に埋め込まれた40万ものコアに、ターゲットのニューラル・ネットワークをそっくり全部マッピングして並列動作させます。 このあまりにもシンプルで、かつ壮大なアイデアをストレートに実現したのはCerebras Systemsというスタートアップ・カンパニーです。 筆者はいくつものスタートアップ、とくにハードウェア・システムを開発する企業を見てきました。Cerebrasについても二年ほど前から何度か訪問して開発状況などを見てきましたが、これほど野心的なスタートアップは滅多にありません。 このCerebrasの技術について

    ウェハースケールCPUの誕生――Cerebrasのクレイジーな挑戦 | gihyo.jp
    denqueue
    denqueue 2020/01/31
    ウェハーを丸ごと使ったCPU、視覚的なインパクトが凄いな。ディープラーニングのワークロードだと逆伝搬のための帯域幅&遅延が重要で大規模チップ実装がメリットになるということなのかな?
  • 1