Observe 34 min

Persist Progress

Membuat investigasi quant bisa dilanjutkan tanpa mengandalkan chat memory.

Failure pattern

Agent menyelidiki drawdown momentum strategy, session berakhir, lalu agent berikutnya mengulang kerja dari awal dan memberi kesimpulan berbeda. Bukan karena model bodoh, tetapi karena progress tidak durable.

Long-running research butuh memory yang bisa diaudit, bukan sekadar history percakapan.

Incident: Drawdown investigation yang berputar

Agent pertama menemukan bahwa drawdown kemungkinan terkait exposure ke low-liquidity names saat volatility spike. Ia belum selesai mengecek transaction cost dan sector exposure. Session berhenti.

Agent kedua masuk, membaca prompt pendek, lalu menyalahkan earnings revision. Dua analisis tampak masuk akal, tetapi tidak ada state record yang menjelaskan apa yang verified, rejected, dan unresolved.

Harness principle

Persist progress berarti setiap sesi meninggalkan research state yang dapat dilanjutkan: verified findings, rejected hypotheses, open questions, evidence IDs, dan next action.

Untuk quant agent, ini penting karena research sering berjalan bertahap: screen, inspect, backtest, compare, review, revise.

Operating practice

Gunakan progress record:

Verified:
- drawdown concentrated in low-liquidity bucket
- momentum signal version v3 active during period

Rejected:
- missing price data is not the cause
- benchmark mismatch not observed

Unresolved:
- transaction cost sensitivity
- sector exposure contribution

Next action:
- run cost sensitivity with config cost_model_v2

Catatan ini harus hidup di artifact yang bisa ditemukan, bukan hanya chat.

Product-agent example

Agent berikutnya tidak memulai dengan “analyze the drawdown.” Ia memulai dari next action. Jika ia tidak setuju, ia menambah evidence baru, bukan menimpa cerita lama.

Dengan begitu, research menjadi additive.

Common mistakes

Kesalahan umum adalah menyimpan final summary saja. Investigasi butuh jejak path yang gagal juga. Hypothesis yang sudah rejected sama pentingnya dengan conclusion.

Kesalahan lain adalah mencampur verified dan suspected. Dalam quant work, beda dua kata itu bisa menentukan apakah memo layak masuk review.

Practical exercise

Ambil investigasi terakhir yang belum selesai. Tulis progress record dengan empat bagian: verified, rejected, unresolved, next action.

Key takeaways

  • Chat memory bukan durable research state.
  • Verified, rejected, dan unresolved harus dipisah.
  • Next action membuat sesi berikutnya mulai dari titik yang benar.

Further reading / source notes

Bagian ini dipengaruhi praktik long-running agent, research notebook discipline, dan audit trail untuk analytical workflow.