【Cody】AI駆動開発でChrome拡張機能をつくった話
📖 詳細な説明
🎬 YoutubeTranscriptCopier開発成果
機能概要と実用性
YouTube動画の文字起こしを簡単にコピーできるツールとして開発されたChrome拡張機能です。単純な文字起こしコピーに加え、プロンプト付きコピー機能を実装しています。
主要機能:
- 単純コピー: 文字起こしのみのコピー
- プロンプト付きコピー: 「プロンプト+文字起こし」の統合コピー
- 自動保存: 入力欄に入れたプロンプトの自動保存
- テンプレート: 要約用プロンプトの3種類×3言語(英語・日本語・中国語)提供
💡 開発動機:手作業効率化の必要性
従来手順の煩わしさ分析
YouTube動画からLLMへの文字起こし活用において、6段階の面倒な手順が存在していました:
- ステップ0: Youtubeの動画を開く
- ステップ1: 「もっと見る」となっている概要欄を開く
- ステップ2: 「文字起こしを表示」をクリック
- ステップ3: 右側の文字起こしを全選択してコピー
- ステップ4: 好きなLLMに貼り付ける
- ステップ5: 「要約して」とプロンプトを加える
既存の問題点
意外と手順が多く、特に文字起こしの一括コピーができないため、動画が長くなるほど選択に時間がかかるという効率性の問題がありました。
🛠️ 自作開発の戦略的理由
既存拡張機能の課題
似たような拡張機能は多数存在し実際に使用していましたが、以下の問題が頻発していました:
技術的問題:
- YouTubeのアップデートによる動作停止
- LLM側のアップデートによる互換性問題
- 頻繁な機能停止
商業的問題:
- 最初は無料、後に課金制への移行
- 課金移行のペースが早い傾向
- サービス継続性への不安
自作による解決策
手元で作れば動かなくなった時に自分で修正できるという保守性の観点から、実際に役に立つものを自作することを決断しました。
🤖 Cody:AI駆動開発ツールの詳細評価
Codyの基本情報
SourcegraphのCodyは、CursorとVSCodeの両方で使用可能なAI駆動開発拡張機能です。CursorのAI開発機能との混同に注意が必要です。
公式URL: https://sourcegraph.com/cody
包括的利点分析
✅ Codyの強力なアドバンテージ:
- コスパ最強: 月額9ドルで使い放題
- 高性能AI: Claude 3.5 Sonnet使い放題
- コードベース理解: プロジェクト全体の文脈を把握
- 競争優位性: 他のAI駆動開発ツールより圧倒的に安価
実際の問題点と制約
⚠️ Codyの課題と改善点:
- apply機能の不安定性: 結構癖があり、適用が下手
- 変更箇所の不明確性: 変更箇所を明示しない傾向
- コード省略: 省略してコードを提示することがある
🔬 AI モデル比較と将来展望
Claude 3.5 Sonnet の現状評価
2025年1月9日現在、Claude 3.5 Sonnetはプログラミング分野で最強と考えられますが、ちょっといまいちになってきていると感じる傾向があります。
次世代候補:Gemini 2.0 Flash Experimental
次点でGoogleAIStudioのGemini 2.0 flash experimentalが注目に値します:
優位性:
- 圧倒的な速度: とにかく早い処理
- 高精度: 精度も高水準を維持
- 完全コード提示: ケチらずに全コードを速攻で提示
- 実用性: 本当にコピペでいける完成度
🚀 今後の展望と個人開発革命
技術共有とコミュニティ発展
次回はChrome拡張機能自体の話とリリースの流れを詳細に説明し、真似して好きな拡張機能をみんなが作ってくれれば、個人開発の時代が進んで楽しくなるというビジョンを実現したいと考えています。
AI駆動開発による社会変革
AI駆動開発で個人開発者が増えれば、世界は変わるという信念のもと、技術の民主化と個人の創造力解放を目指しています。