週報 2026-02-14

年明けから2ヵ月経っていて、やばい

コーディングエージェントを触っている

  • 世の中がエーアイになっており、このビッグウェーブに乗るしかないとなったため
  • できればオープンウェイトなモデルがいいな…という気持ちがありopencode+glm/kimiを使っている *(金銭的事情を無視すれば)いざという時ローカルで動かすことが可能なため
  • 抽象的な指示でもコードベースを見ながらバリバリ実装してくれてすごいとなっているが、まだ自分でも気づけるレベルの実装・判断ミスをするな…という感じ
    • RustからJavaのライブラリコールをしてくれと頼んだのに、JavaからRustのライブラリコールを実装する
    • MtGのシミュレータを作ってくれと(公式ルールの完全な文章付きで)頼んだのに、プレイヤーのフェイズ移行を間違える など
  • ただ、これはモデルの進化+コンテキストエンジニアリングってやつで何とかなる範囲かもしれん
  • どちらかというと問題は生成された結果をチェックする負荷がやばいことにあるかも
    • 今まではコーディングしながらコードベースの内容を頭に入れていたのが、いきなり出来上がったコードを0から読むことになるため
  • また、作業指示を自然言語で出す部分もやってみると意外と難しい
    • 言語化する際に頭の中にある情報を100%で出せるわけではないので…
    • こういったある種のハードルを乗り越えるために vibe が必要なんだろうな…と今のところ感じている

せっかくだし Kaggleにも手を出している

  • https://www.kaggle.com/competitions/deep-past-initiative-machine-translation/discussion?sort=votes
    • 古アッカド語→英語の翻訳コンペ
  • こちらも llmってやつで何とかできんかとか考えていたが、結局は自分で問題を理解したうえでツール的に使う方が(まだ)よさそうに見えている
    • 「このコンペで金メダルを取って」レベルの指示では、まだagentはうまく動かなそう
    • これも使ってるモデル/ツール等の問題かもしれんが
  • 古アッカド語は歴史的に見てもかなり古い かつ リンガフランカとして使われている言語らしく、コンペ抜きでも興味を惹かれる

MtG Arena の開発者の書いた記事が面白かった

  • https://magic.wizards.com/en/news/mtg-arena/on-whiteboards-naps-and-living-breakthrough
  • Arena 内部ではMtGの処理を、「基本的な動作を行うエンジン」と「エンジンの状態を書き換える(ある種のプログラムとして表現された)カード」の二つで行ってるっぽい
    • これは「一つのエンジンが、MtGの処理すべてを行う」というモデルとは対照的に見える
  • MtGの非公式エンジンである forge も似た実装をしているように見える
  • 普段MtG関連の記事はデッキビルドとかカードデザインの話とかしか見えないがちなので、こういう開発の舞台裏みたいな記事は新鮮で面白かった

ブレワイをやった && ティアキンをやっている

  • ブレワイめちゃくちゃ面白かった。なんで俺はこんな最高のゲームをn年見逃していたんや…
  • 早速ティアキンをプレイしているが、実はインターネットでかなりのネタバレを踏んでしまっており、プレイ中にこれがフラッシュバックのように頭に浮かんでしまう
    • ブレワイは伏線があるタイプのストーリではなかったので、ティアキンも同じ感じだろと完全に油断していた…
  • ただそれでも楽しいので、マジですごい
  • プレイしたら感想を書きたい

Last modified on 2026-02-14