雑記などいろいろブログ

Kiroが一般提供されてたので、実際に使ってみた所感など


Google Antigravityが全ての話題をかっさらっていったが、先週にKiroが一般提供されていたので使ってみたら想像以上にすごかった。
せっかくなので、今やってる研究テーマに関連する、1つ思い付いたアイデアを実際に作らせてみた。具体的には、オープンボキャブラリー物体検出モデルのYOLO-World [CVPR’24] が「単語などの短いテキストしか扱えない」という課題に対して、高速性はそのままに、もっと文脈を理解して長めの文章からでも物体を検出できるようになることを目指している。今回は、YOLO-Worldで長文を単語レベルに分割して検出したあと、軽量MLPでリランキングするモジュールを後付けしてみて、文脈精度がどれくらい向上するか?という実装を0からKiroで作ってみた。

やったこと

まず、思い付いた研究テーマを書き出して、ChatGPTで要件の深掘り・先行研究調査をして簡単な仕様書を作成する。それをKiroに渡して、 詳細な仕様書、実装計画書、などなどのMarkdownファイルを作成してもらう。これが全部出来上がったら、実装計画書のMarkdownの実行ボタンをポチポチするだけで後はよしなにやってくれる。
...ここまでなら、Claude Codeでも頑張ればできるように見えるけれども、Kiroは仕様に追従しようとする力と、全てにテストコードを書いてくれるのが特に強い。加えて、これはKiroの使い心地の話になるが、Kiroはユニットテストが落ちた時や、実行してエラーが起きた場合に自動でログを見て解決してくれるので、こちら側は何も操作しなくて良いのが楽。

もしかして、プレビュー版の時と比べて、学習データが増えたことで一般提供版はかなり性能が上がってるのかもしれない。

最近のKiroは凄く良くなってる(らしい) ので、最初に触っただけの人はもう一回触ると良い(らしい)
#SDD_findy
https://x.com/fujii_yuji/status/1993159605007130893

最近は仕様駆動開発(SDD)という言葉をよく耳にするが、将来的には「各関数の挙動や仕様さえ大まかに把握できればOKで、実際のコードを読もうとしても読みに行くのにひと手間かかる」ようなUXのエディタが主流になってもおかしくないな~を改めて実感するようになった。(AndroidのSDKソースを確認しようとすると、デコンパイルを経由してワンクッション挟まないと実際のコードを読めないようなイメージ)
今後、ユーザーに近いものづくりをするエンジニアに必要な力は、AIに要件を正確に素早く伝えるために技術的な知見と基盤となる仕組みへの理解(ツールの使い方やContext Engineeringではない)や、潜在的にユーザーが抱える課題を汲み取って場当たり的な解決ではなく根本の解決ができる力、あたりかなと一旦考えをまとめておく。

備考

ちなみに、このブログのCMS構築もほとんどKiroに任せつつ、少しデザインを手直しして作っている。最初はGoogle Antigravityで仕様駆動で作っていたが、細かい挙動で毎回エラーが出るのと、デザインもAIの安っぽい感じになってしまったのでやめた。Kiroは、既存の実装(例:右上のハンバーガーメニュー)やUIパターンをうまく組み合わせて取り入れてくれるようになり、やっとガチガチなContext Engineeringをしなくても良い感じに作ってくれるAIエディタが来た!という感覚になった。