deeptierエンジニアチームの中心メンバーである本田と正木へのインタビュー連載。第2回のテーマは、「Human-AI Hybrid Development Method」における品質の担保です。
生成AIによって、コードを書く速度は確実に上がりました。
しかし、速く書けることと、リリースできる品質に到達していることは別の問題です。
前回の記事で、本田は「設計書さえちゃんとしたものが出来上がっていれば、必ず約束された品質以上のものが上がってくる」と話しました。では、その「約束」は何によって担保されているのでしょうか。
その答えの一つが、テストコードであり、さらにそれを開発プロセスに組み込んだ「品質ゲート」です。
「品質ゲートっていう仕組みは、最初に正木さんが考えてくれたんですよ」と本田は言います。
品質ゲートとは、AIが生成したコードをそのまま人間のレビューに渡すのではなく、一連のチェックをすべて通過するまで次の工程に進めない仕組みです。
「『品質ゲート』という考え方自体は、もともとソフトウェアエンジニアリングの文脈で存在しており、主にCI(Continuous Integration)のプロセスで活用されてきました。その品質ゲートの概念を、AIによる実装フローにも適用することで、AIのアウトプット精度を向上させられるのではないか、という仮説を出発点としています。これまでは人間の開発フローやCI上で機能していた品質保証の仕組みを、AI生成プロセスにも組み込むことで、生成されるコードの信頼性や一貫性を高めることを目指しています。」(正木)
バックエンドでは、コード規約チェック、コンパイル、自動テスト、APIの入出力検証、正常動作の確認を順に実行します。フロントエンドでも、コード規約チェック、コンパイル、AIによるレビュー、自動テスト、画面操作を通じた動作確認を行います。
どれか一つでも失敗すれば、AIはエラーログを読み取り、コードを修正し、再びチェックを実行します。人間が一つひとつ指摘して直させるのではなく、AI自身が失敗理由を読み取り、修正し、再検証する。すべてのゲートを通過したコードだけが、人間のレビューに上がってきます。
つまり品質ゲートは、AIが生成したコードに対して、通過すべき基準をあらかじめ定め、その基準を満たすまで次へ進ませない仕組みなのです。
こうした仕組みがなぜ必要なのでしょうか。背景には、今、システム開発の現場で起きている変化があります。
生成AIを使えば、実装のスピードは確実に上がります。実際、インターネットやSNS上でも、AIによって開発速度が大きく向上したという話は数多く見られます。
一方で、正木はその流れに対して、別の観点から注意が必要だといいます。
「AIで開発が速くなった、という話はよく聞くようになりました。ただ、その後ろで、テストや確認を誰がどう担うのか。そこまでセットで語られているケースは、まだ多くないように感じています 」(正木)
実装速度が上がれば、開発全体のボトルネックも変わります。
コードを書く工程が短縮される一方で、仕様通りに動くか、想定外の入力に耐えられるか、運用後の変更に耐えられるかを確認する工程の重要性は、むしろ高まります。
AIを使えば実装は速くなります。しかし、システム開発において「動く」と「正しい」は同じではありません。そしてここには「高い品質の状態を知らないと、品質の高いものが作れない」という構造的な問題があります。品質の基準を持っていなければ、AIが出したものが正しいかどうかの判断もできないのです。
本田も、AI開発をめぐる議論には、同じような違和感を持っています。
「品質の話は、ほとんど出てこないんですよ。試験どうすんねんとか。誰も何も言わない」
では、「リリースできる品質」とは具体的に何を指すのでしょうか。
本田は、主に三つの観点を挙げます。
一つ目は、要件通りに動作すること。
二つ目は、セキュリティ上の問題がないこと。
三つ目は、運用保守に耐えられること。
この中でも、特に見落とされやすいのが運用保守性です。「コードの中に同じ処理がめっちゃ何行もあって、一か所を直したら全然関係ない機能まで壊れてしまう、みたいなことがよく起きるんです。これは絶対ダメなんですよ」(本田)
一か所を修正しただけで別の機能が壊れる。こうしたコードは、一見すると「動く」かもしれません。しかし、長く使い続けるシステムとしては不十分です。システム開発において、リリースは終わりではなく、運用の始まりであり、その後の運用に耐えられる作りになっているかどうかが、本当の品質になります。
「高速で、実運用に対応できる品質のシステムをつくる。そこが一番力を入れているところ」と本田は言います。品質ゲートが設計されているのは、この三つのポイントを仕組みとして担保するためなのです。
品質ゲートをすべて通過したコードは、次に人間のレビューに渡ります。ここで人間が見るのは「ルール通りか」でなく、「業務要件を実現できているか」です。
「AIの実装力はかなり高いですが、ちゃんと人間が見ないといけない部分があります」(正木)
システム全体を通した動作確認でバグが出た場合も、自動修正は行いません。仕様の食い違いや設計の誤りは、AIには判断できないためです。ここだけは、必ず人間の目が必要になります。
本田は生成AIが登場した当初、こんな印象を持ったといいます。
「AIが作ったものを見もせず、判断もせず、そのまま出すのは危ない。上がってきたものは、妥当ですか?正しいですか?それを問わないと、品質は担保できないんですよ」(本田)
その問いに答えられる人間がいて、初めて速さは意味を持つのです。
AIによって、システム開発の実装速度は大きく変わりました。しかし、速く作れることと、安心してリリースできることは同じではありません。
品質ゲートは、AIが生成したコードをそのまま人間のレビューに渡すのではなく、あらかじめ定めた基準を満たすまで次へ進ませない仕組みです。複数の関門を通過したうえで、最後に人間が業務要件との整合性を確認します。
AIに任せるべき検証は、仕組みとして徹底する。
AIには判断できない業務上の妥当性は、人間が引き受ける。
この役割分担があるからこそ、速さは単なるスピードではなく、リリースできる品質へとつながります。
速さだけを追うのではなく、速さと同時に品質を担保する。
それが、deeptierの「Human-AI Hybrid Development Method」が目指す、AI時代の開発プロセスです。
■関連記事
なぜdeeptierはAI×人間のハイブリッド開発に行き着いたのか——独自の開発手法「Human-AI Hybrid Development Method」の裏側にある思想
【deeptierのシステム受託開発】現状の課題やビジネスゴールについて、壁打ちベースからご相談を承ります。
【本記事の監修者】
本田 哉樹
株式会社deeptier マネージャー
Web系企業での開発経験を通じて、日本のシステム開発が抱える構造的な問題を肌で感じ、フリーランスとして独立。 独立後は、炎上・崩壊寸前のプロジェクトへの参画を主戦場とする。
曖昧な責任体制、形骸化したプロセス、意思決定の停滞——こうした状況を「前提条件」として受け入れ、機能しないものを整理し、成果が出る構造に組み直すことをキャリアを通して積み重ねる。顧客折衝・設計・実装・進行管理を統合することで、情報の分断による遅延を排除し、様々な技術・環境においても再現性のあるシステム開発をリード。
「エンジニアの価値は知識量ではなく、未知を即座に戦力化して成果につなげられるか」が持論。各現場で得た知見を共通構造として抽出・再構築することで、Human-AI Hybrid Development Methodの設計思想に至る。
正木 拓馬
株式会社deeptier エンジニアリーダー
海外大学にてソフトウェア工学を専攻し、欧州企業にてWebアプリケーション開発に従事。多国籍チームでの開発経験を通じ、グローバル環境における実践的な知見を有する。
人材紹介会社では、社内ユーザー数100万人規模の基幹システムにおいて、フロントエンドからバックエンド、バッチ処理までを横断した設計・開発を担当。拡張性・保守性を重視したアーキテクチャ設計および開発プロセス改善を推進。
現職では、Webアプリケーション開発基盤の設計・標準化を主導するとともに、AIを活用したコード生成パイプラインおよび品質管理プロセスの設計・導入に従事。実務に根ざした開発基盤設計およびプロセス改善を専門とする。
※この記事について
本インタビューは2026年5月に実施いたしました。肩書や所属はインタビュー実施当時のものであり、インタビュー時点の一般的な開発情報に基づいて執筆されています。技術トレンドの変化により、推奨されるツールや手法は変わる可能性があります。
記事/構成:deeptier マーケティングチーム