LLM の本を読み始める

永らくデスクの上に棚ざらしになっていた「大規模モデル入門」をようやく読み進める時間が取れるようになった。

前半は word2vec から transformer, LLM に至る過程を、数式を交えて解説しているのだが、しばらく数学を使っていなかった頭でついていくのはなかなか大変である。1ポモドーロで3~4ページ進むのがやっと。

この本は実行例が豊富に乗っているので、各プログラムを Jupyter notebook で動かしながら確認している。プログラムは Google Colaboratory しか正式サポートしていないが、今のところ、ローカルでも動くようだ。(もっとも私の PC は RAM 128GB、VRAM 24GB という代物だが)

勤務先に夏イベントがあるようなので、それまでに読み進めて何かアウトプットできると良いなと思っている。

投稿者について
みのしす

小さいときは科学者になろうとしたのに、その時にたまたま身に着けたプログラミングで未だに飯を食っているしがないおじさんです。(年齢的にはもうすぐおじいさん)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です