Specify 34 min

Define the Work Surface

Membatasi permintaan quant research supaya agent tidak meloncat dari ide mentah menjadi trade thesis yang terlalu percaya diri.

Failure pattern

Quant Analyst AI Agent menerima permintaan yang terdengar wajar: “find a long/short idea in semiconductors.” Masalahnya, kalimat itu belum menjadi pekerjaan. Belum ada universe, horizon, benchmark, risk limit, data source, atau standard evidence. Agent bisa saja menjawab dengan thesis yang rapi, tetapi thesis itu berdiri di atas ruang kerja yang kabur.

Di tim investment, kegagalan seperti ini berbahaya karena output agent sering terlihat matang: ada ticker, chart, factor explanation, dan narasi catalyst. Padahal agent belum tahu apakah ia sedang diminta screening, hypothesis generation, backtest, atau draft memo untuk review.

Incident: Semiconductor idea yang terlalu cepat jadi thesis

Seorang analyst meminta ide long/short untuk sektor semiconductor menjelang earnings season. Agent menarik beberapa data, memilih dua saham, menulis thesis long quality compounder dan short cyclic laggard, lalu menutup dengan suggested sizing.

Outputnya meyakinkan, tetapi review menemukan beberapa lubang: universe tidak jelas, horizon campur antara 2 minggu dan 12 bulan, benchmark tidak disebut, factor exposure tidak dicek, dan “suggested sizing” melewati batas karena agent hanya boleh membuat advisory trade idea, bukan final decision.

Agent task

Tugas yang benar seharusnya:

Cari 2-3 kandidat long/short semiconductor untuk research lanjutan.
Universe: US listed semiconductor names di coverage list.
Horizon: 1-3 bulan.
Output: hypothesis brief, evidence table, risk questions.
Dilarang: final recommendation, sizing, order instruction.
Escalate: jika data earnings atau estimate tidak fresh.

Brief seperti ini membuat agent tahu lantai tempat ia berdiri. Ia boleh berpikir luas, tetapi outputnya dibatasi.

Harness principle

Work surface adalah batas pekerjaan yang bisa diselesaikan, diverifikasi, dan ditolak. Untuk quant agent, work surface harus menjawab enam hal: universe, timeframe, allowed data, allowed output, prohibited action, dan evidence standard.

Tanpa itu, agent akan mengisi kekosongan dengan kebiasaan model: membuat jawaban lengkap. Dalam research, lengkap belum tentu benar. Yang dibutuhkan adalah output yang sesuai mandate.

Operating practice

Sebelum agent mulai research, minta ia mengubah request menjadi work-surface brief. Reviewer harus bisa melihat:

FieldContoh
UniverseUS semiconductor coverage list
Horizon1-3 bulan
DataPrice, estimates, factor exposure, latest filings
OutputHypothesis brief dan evidence table
Not allowedSizing, execution, final investment decision
EvidenceSource freshness, benchmark, downside question

Jika brief belum cukup, agent berhenti. Itu bukan friction; itu guardrail pertama.

Product-agent example

Harnessed agent tidak langsung menulis “Buy NVDA, short X.” Ia mulai dengan:

  1. Mengonfirmasi universe dan horizon.
  2. Menarik kandidat dari screen yang disepakati.
  3. Menulis hypothesis sebagai candidate, bukan recommendation.
  4. Menandai data yang belum fresh.
  5. Mengirim paket untuk analyst review.

Perbedaannya besar. Agent tetap berguna, tetapi tidak mengambil authority yang tidak diberikan.

Common mistakes

Kesalahan pertama adalah menganggap prompt panjang otomatis aman. Prompt bisa panjang tetapi tetap tidak memberi batas. Kesalahan kedua adalah mencampur research output dan investment action. Advisory trade idea masih perlu review gate manusia.

Kesalahan ketiga adalah membiarkan agent memilih sendiri evidence standard. Dalam quant workflow, evidence harus ditentukan sebelum kesimpulan, bukan setelah thesis ditulis.

Practical exercise

Ambil satu request research yang sering muncul di tim Anda. Tulis ulang menjadi work-surface brief dengan universe, horizon, data source, allowed output, prohibited action, dan escalation rule.

Key takeaways

  • Work surface mengubah request kabur menjadi pekerjaan yang bisa diverifikasi.
  • Quant agent boleh menghasilkan analysis dan hypothesis, tetapi final decision tetap manusia.
  • Batas output sama pentingnya dengan data yang diberikan.

Further reading / source notes

Konsep ini selaras dengan harness engineering untuk membatasi agent work, human-in-the-loop review untuk domain berisiko tinggi, dan praktik model risk management yang menuntut evidence sebelum approval.