Skip to content

Instantly share code, notes, and snippets.

View Motifman's full-sized avatar

Kei Minagawa Motifman

View GitHub Profile
@Motifman
Motifman / issue154_gemma4_v3_full_tables.md
Created May 17, 2026 17:06
Issue #154 第4回実験: PR #172/#173(signpost・tick_budget)適用後 Gemma 4 31B / TICKS=30 / R1 WIN達成

Issue #154 再実験フル表(自動採取)

  • 各試行の外側シミュレーション駆動回数: 30ISSUE154_MAX_TICKS)。 表の tick はワールド時刻。do_move / do_wait 等が内部でさらに advance_tick するため、tick の最大値は駆動回数より大きくなり得る。
  • scenarios: /Users/minagawa/Research/llm_trpg_project/ai_rpg_world/data/scenarios
  • OPENAI_API_BASE: configured
  • LLM_MODEL: openai/gemma-4-31b-it-nvfp4

G1 — ゲーム終了結果サマリー

| 試行 | 結果 | 終了 tick | 経過時間 (s) |

@Motifman
Motifman / issue154_gemma4_v2_full_tables.md
Created May 17, 2026 15:28
Issue #154 第3回実験: PR #165/#166/#167 適用後 Gemma 4 31B / TICKS=30 / G1-G4観察

Issue #154 再実験フル表(自動採取)

  • 各試行の外側シミュレーション駆動回数: 30ISSUE154_MAX_TICKS)。 表の tick はワールド時刻。do_move / do_wait 等が内部でさらに advance_tick するため、tick の最大値は駆動回数より大きくなり得る。
  • scenarios: /Users/minagawa/Research/llm_trpg_project/ai_rpg_world/data/scenarios
  • OPENAI_API_BASE: configured
  • LLM_MODEL: openai/gemma-4-31b-it-nvfp4

G1 — ゲーム終了結果サマリー

| 試行 | 結果 | 終了 tick | 経過時間 (s) |

@Motifman
Motifman / issue154_gemma4_full_tables.md
Created May 17, 2026 14:33
Issue #154 再々実験: Gemma 4 31B (vLLM v108) / TICKS=30 / G1-G4観察付き

Issue #154 再実験フル表(自動採取)

  • 各試行の外側シミュレーション駆動回数: 30ISSUE154_MAX_TICKS)。 表の tick はワールド時刻。do_move / do_wait 等が内部でさらに advance_tick するため、tick の最大値は駆動回数より大きくなり得る。
  • scenarios: /Users/minagawa/Research/llm_trpg_project/ai_rpg_world/data/scenarios
  • OPENAI_API_BASE: configured
  • LLM_MODEL: openai/gemma-4-31b-it-nvfp4

G1 — ゲーム終了結果サマリー

| 試行 | 結果 | 終了 tick | 経過時間 (s) |

@Motifman
Motifman / issue154_full_tables.md
Created May 17, 2026 13:56
Issue #154 再実験(vLLM/OPENAI_API_BASE)フル表

Issue #154 再実験フル表(自動採取)

  • 各試行の外側シミュレーション駆動回数: 18ISSUE154_MAX_TICKS)。 表の tick はワールド時刻。do_move / do_wait 等が内部でさらに advance_tick するため、tick の最大値は駆動回数より大きくなり得る。
  • scenarios: /Users/minagawa/Research/llm_trpg_project/ai_rpg_world/data/scenarios
  • OPENAI_API_BASE: configured
  • LLM_MODEL: openai/gpt-5-mini(環境変数未設定のため liteLLM 既定文字列が送られる)

表 A — タイムライン (R1_default)

| tick | player | event | detail |

@Motifman
Motifman / issue154_full_tables.md
Created May 16, 2026 18:28
Issue #154 再実験フル表(自動採取)R1/R2/R3

Issue #154 再実験フル表(自動採取)

  • 各試行の外側シミュレーション駆動回数: 18ISSUE154_MAX_TICKS)。 表の tick はワールド時刻。do_move / do_wait 等が内部でさらに advance_tick するため、tick の最大値は駆動回数より大きくなり得る。
  • scenarios: /Users/minagawa/Research/llm_trpg_project/ai_rpg_world/data/scenarios

表 A — タイムライン (R1_default)

tick player event detail
1 A(オペレーター) tool_call spot_graph_explore {"inner_thought": "制御盤や部屋の詳細を確認して、扉の解除方法や手がかりを探す。"}