MEMO No. 01 — 前提整理 DRAFT

Audio Skill, before the build. 音声化Skillの前提を、いちど紙に置く。

DATE2026.05.01 OWNERshoichi STAGEpre-prototype NEXT40_意思決定.md

01 ／ Why ─ 何をしたいか

§01読まずに、触れた感じにする。

ClaudeCode で生成された 30 ページ級のリサーチレポートが手元に積み上がっている。腰を据えて読み切る時間は確保しづらく、出先や移動中に開くのは消耗が激しい。だから読み切ろうとする代わりに、通勤・徒歩・家事の隙間時間にラジオを流すように耳から取り込み、最低限「どこに何が書いてあったか」の地図だけは頭に置いておきたい。

全部読まないと不安→全部触れた感じはする

体感ゴールの言い換え。完全読了は捨て、輪郭の把握に振り切る。

02 ／ Material ─ いま手元にあるもの

§02素材は、4本＋統合判定の山。

題材は ClaudeCode 活用 AI コンサルの新規事業検討で、上場ジャンル分類・上場ニーズ分析・非上場プレイヤー・買い手の発注実態の 4 本の並列リサーチと、それを束ねる統合判定がすでに ~/worker/ObsidianSync/101_StellarCreate/201_新規事業/202605_ClaudeCode-AI-コンサル/ に揃っている。各本が 30 ページ前後あり、合計の読み込みコストは小さくない。

運用は二層を想定している。半ページのサマリーカードは日中にデスクで読み、生レポートそのものは音声に変換して移動中に流す。読むことと聴くことの守備範囲を分けるという発想。

03 ／ Candidates ─ 候補と論点

§03道具はだいたい見えていて、まだ決めていない。

候補は 3 軸ある。NotebookLM の Audio Overview は 2 人会話形式で 10〜15 分の Podcast を無料で出してくれる手軽さがある。ElevenLabs と OpenAI TTS は API 駆動なのでローカルからの自動化に組み込みやすい。最終的に Claude Code Skills として叩ける形にまとめれば、新規リサーチが増えるたびに同じ手順で音声化できる。

論点

全件音声化するのか、絞り込み運用にするのか。スクリプトを 2 人会話で書くか、1 人ナレーションで書くか。iPhone への同期と再生フローをどう組むか。新規リサーチの追加に対して手動運転を許すか、ホットフォルダで自動化するか。

検討の順番

ツールの最終選定は体感を取る前には決めない方針。NotebookLM をまず 1 本通して耳に入れてみて、品質・尺・話し方が許容できるかを確かめてから、API 自前ルートやスキル化の必要性を判断する。

04 ／ Definition of Done ─ 成功条件

§04「数分以内」と「倍速・復帰位置」が要点。

速度: 新しいリサーチが追加されたら、数分以内に音声化が始まること。手で起動するにせよ自動でも、操作回数は最少。
聴取UX: iPhone で倍速再生と復帰位置記憶が効くこと。途中で切っても次の通勤で続きから聴ける状態。
コスト: NotebookLM 無料枠 + API 数千円までを上限。これを超えるなら自動化を諦めるか別の道を探す。
規模: 月 10 本程度の生成を想定。それ以上を捌く運用設計はいまは不要。

Out of Scope

今回は採用ツールの最終決定までは踏み込まない。NotebookLM をまず体感した上で、その先に API 自前ルートを組むか、プライベート Podcast RSS を建てるかは別判断として残す。配信経路（Cloudflare R2 ＋カスタムドメイン＋ Overcast）の構築有無もこの紙では決めない。

PRE-PROTOTYPE