Pengenalan GPT-5.2 Codex
OpenAI telah resmi meluncurkan model kecerdasan buatan (AI) terbaru mereka yang diberi nama GPT-5.2 Codex. Berbeda dari versi umum GPT-5.2 yang dirilis sebelumnya, model ini hadir sebagai versi khusus yang dioptimalkan untuk penggunaan di ekosistem Codex. Codex adalah agen rekayasa perangkat lunak berbasis cloud yang dirancang khusus untuk membantu proses pemrograman.
GPT-5.2 Codex disebut telah dioptimalkan untuk pekerjaan pemrograman jangka panjang melalui fitur Context Compaction. Model ini juga memiliki kemampuan yang lebih kuat dalam menangani perubahan kode berskala besar seperti refactor dan migrasi. Selain itu, performa GPT-5.2 Codex meningkat di lingkungan Windows dan memiliki peningkatan signifikan dalam hal keamanan siber.
Keunggulan dalam Pemrograman
OpenAI menjelaskan bahwa GPT-5.2 Codex dibangun berdasarkan kemampuan generasi sebelumnya, yaitu GPT-5.2 dan GPT-5.1-Codex-Max. Model AI anyar ini disebut lebih mumpuni dalam memahami konteks panjang, melakukan tool calling yang lebih andal, meningkatkan akurasi fakta, serta mendukung native compaction.
Menurut perusahaan, rangkaian peningkatan tersebut membuat GPT-5.2 Codex jauh lebih bisa diandalkan untuk mengerjakan tugas pemrograman yang berjalan lama. Codex juga dapat menyelesaikan tugas-tugas kompleks, seperti refactoring besar, migrasi kode, hingga pembuatan fitur baru tanpa mudah kehilangan konteks meski prosesnya berjalan lama atau diulang beberapa kali.
Hasil Pengujian yang Mengesankan
Dari sisi performa, GPT-5.2 Codex menunjukkan peningkatan signifikan ketika diuji menggunakan tolok ukur internal mereka. Model AI ini tercatat meraih skor tertinggi pada SWE-Bench Pro dan Terminal-Bench 2.0, dua tolok ukur yang dirancang untuk mengevaluasi sejauh mana coding agent dapat bekerja layaknya programer di dunia nyata.
Pada pengujian SWE-Bench Pro, sebuah model diberikan repositori dan harus menghasilkan patch untuk menyelesaikan tugas rekayasa perangkat lunak yang realistis. Sementara itu, terminal-Bench 2.0 menguji kemampuan model ketika bekerja di lingkungan terminal sungguhan. Tugas-tugasnya meliputi kompilasi kode, pelatihan model, dan pengaturan server.
Dari pengujian dua tolok ukur tersebut, GPT-5.2 Codex mencapai skor akurasi 56,4 persen dari SWE-Bench Pro, dan 64 persen pada Terminal-Bench 2.0. Selain itu, model ini diklaim mampu membaca data tangkapan layar (screenshot), diagram teknis, grafik, atau antarmuka secara lebih akurat.
Fokus pada Keamanan Siber
Keamanan siber menjadi fokus utama GPT-5.2 Codex. OpenAI menegaskan bahwa perkembangan model AI buatan mereka di bidang keamanan siber meningkat pesat. Mulai dari GPT-5 Codex, lalu melonjak lagi di GPT-5.1 Codex-Max, hingga kini kembali naik pada GPT-5.2 Codex.
Untuk memberikan gambaran peningkatannya, OpenAI memaparkan contoh kasus yang melibatkan seorang peneliti keamanan bernama Andrew MacPherson. Andrew yang menjabat sebagai principal security engineer di Privy (sebuah perusahaan Stripe) mencoba menggunakan GPT-5.1-Codex-Max bersama Codex CLI dan agen pengkodean lainnya untuk mereproduksi dan mempelajari kerentanan React. Namun di tengah proses penyelidikan, Andrew mendapati Codex menunjukkan perilaku sistem yang mencurigakan sehingga, menurut dia, diperlukan penyelidikan lebih dalam.
Kerentanan tersebut kemudian dilaporkan secara bertanggung jawab kepada tim React. Menurut OpenAI, kejadian tersebut justru menunjukkan bagaimana sistem AI dapat secara signifikan mempercepat pekerjaan keamanan defensif dalam perangkat lunak yang banyak digunakan di dunia nyata.
Program Trusted Access Pilot
Seiring dengan sistem keamanan yang semakin kuat, OpenAI kini mulai menerapkan kontrol akses yang lebih ketat lewat program bernama Trusted Access Pilot. Program ini akan diberikan melalui undangan khusus kepada pihak-pihak yang memenuhi kriteria tertentu, meliputi:
- Profesional keamanan yang telah diverifikasi dan memiliki rekam jejak pengungkapan kerentanan yang bertanggung jawab.
- Organisasi dengan kasus penggunaan keamanan siber profesional yang jelas.
OpenAI menyebut, pihak yang memenuhi syarat akan mendapatkan akses ke model-model AI mereka yang paling mumpuni untuk keperluan keamanan.
