Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut
Seri Gemini Gemini telah dimulai dari model Great Language Google (hampir setahun yang lalu dengan beberapa insiden memalukan untuk menghasilkan gambar, tetapi telah meningkat dengan mantap sejak saat itu, dan tampaknya perusahaan berencana untuk melakukan upaya kedua dari generasi kedua – Gueini 2.0 – Lebih besar dan lebih baik sejauh ini bagi konsumen dan institusi.
Hari ini, perusahaan Menyatakan Versi umum Gemini 2.0 Flash, yang disajikan oleh Gemini 2.0 Flash-Lite, dan menyajikan versi eksperimental Gemini 2.0 Pro.
Model-model ini, yang dirancang untuk mendukung pengembang dan perusahaan, sekarang dapat mencapai Google AI Studio dan Vertex AI, dengan flash-lite dalam pratinjau publik dan Pro untuk tes awal.
“Semua model ini akan menampilkan input multimodal dengan output teks pada rilis, dengan lebih banyak modalit siap untuk penerbangan umum dalam beberapa bulan mendatang,” Koray Kavukcuoglu, CTO dari Google DeepMind, hafal dalam posting blog Announment perusahaan – Showcast An Iklantil Are Google Are Google Are Google Are Google Di atas meja bahkan ketika pesaing seperti Deepseek dan Openai terus meluncurkan pesaing yang kuat.
Google bermain pada episode multimedia
Deepseek-R1 atau model O3-Mini baru dari OpenAI dapat menerima input multimedia-apa pun dan mengunduh file atau lampiran.
Sementara R1 dapat menerimanya di situs web dan aplikasi mobil selulernya, model ini mengarah ke teknologi Visual Letters (OCR) lebih dari 60 tahun, untuk mengekstrak teks hanya dari unduhan ini-jangan untuk memahami atau menganalisis salah satu fitur lain yang terkandung dalam mereka.
Namun, keduanya adalah kategori baru model “pemikiran” yang dengan sengaja membutuhkan lebih banyak waktu untuk memikirkan jawaban dan memikirkan “rantai ide” dan validitas tanggapan mereka. Ini bertentangan dengan LLMS khas seperti seri Gemini 2.0 Pro, sehingga perbandingan antara Gemini 2.0, Deepseek-R1 dan OpenAI O3 adalah sedikit apel dengan perangkat lunak.
Tapi ada beberapa berita di depan pikiran hari ini dari Google, juga: Google Sundar Pichai mengambil X Jejaring Sosial Untuk mengumumkan itu Google Gemini Sistem seluler dan Android telah diperbarui menggunakan model Gews Gemini 2.0 Flash Thinking Gemini 2.0. Model ini dapat dihubungkan ke Google, YouTube dan Google Search Maps, memungkinkan serangkaian penelitian dan interaksi yang sepenuhnya baru yang bekerja dengan bahan kecerdasan buatan yang tidak bisa hanya mencocokkan layanan tanpa layanan seperti Deepseek dan Openai.
Saya mencobanya segera di aplikasi Google Gemini iOS di iPhone saya saat menulis karya ini, dan itu mengesankan berdasarkan pertanyaan awal saya, memikirkan denominator umum dari 10 video terbaik di YouTube yang paling populer di bulan lalu dan juga memberikan saya memberi saya Dari kantor dokter terdekat dan jam buka /tutup, semua dalam hitungan detik.
![](https://venturebeat.com/wp-content/uploads/2025/02/IMG_1571.png?w=276)
![](https://venturebeat.com/wp-content/uploads/2025/02/IMG_1575_e5459f.png?w=276)
Gemini 2.0 Flash memasuki versi umum
Gemini 2.0 Flash, yang sudah diluncurkan sebagai versi uji coba pada bulan Desember, siap untuk diproduksi.
Ini dirancang untuk aplikasi kecerdasan buatan yang sangat efisien, memberikan respons total yang rendah dan mendukung pemikiran multimedia dalam skala besar.
Salah satu manfaat utama adalah bersaing di jendela konteksnya, atau jumlah simbol yang dapat ditambahkan pengguna dalam bentuk klaim dan menerima lagi dalam satu interaksi, dengan mempertimbangkan aplikasi obrolan atau API (API).
Sementara banyak model perintis, seperti O3-mini baru dari Openai, yang pertama kali muncul dalam sepekan terakhir, hanya mendukung 200.000 atau kurang dari simbol khas-tentang setara dengan novel dari 400 hingga 500 halaman Gemini 2.0 Flash mendukung sejuta , yang berarti mampu menangani jumlah informasi, yang membuatnya sangat berguna untuk tugas frekuensi tinggi dan pengukuran luas.
Gemini 2.0 flash-lite untuk menekuk kurva biaya ke level terendah sejauh ini
Gemini 2.0 Flash-Lite, pada saat yang sama, adalah LLM yang sama sekali baru yang bertujuan memberikan solusi kecerdasan buatan berbiaya yang efektif tanpa mengurangi kualitas.
Google DeepMind menyatakan bahwa flash-lite mengungguli pendahulunya penuh (lebih besar dari parameter), Gemini 1.5 flash, pada standar pihak ketiga seperti MMLU Pro (77,6 % dibandingkan dengan 67,3 %) dan SQL Bird (57,4 % melawan. 45,6 %) , sambil mempertahankan harga dan kecepatan yang sama.
Ini juga mendukung input multimedia dan fitur bingkai konteks satu juta simbol, mirip dengan model flash penuh.
Saat ini, Flash-Lite tersedia dalam inspeksi umum melalui Google AI Studio dan Vertex AI, dengan tahun yang diharapkan dalam beberapa minggu mendatang.
Seperti yang ditunjukkan pada tabel di bawah ini, Flash-Lite Gemini 2.0 dihargai $ 0,075 per juta kode (input) dan $ 0,30 per juta kode (output). Flash-Lite ditempatkan sebagai opsi dengan harga yang sangat wajar untuk pengembang, mengungguli GEINI 1.5 di sebagian besar kriteria sambil mempertahankan struktur biaya yang sama.
![](https://venturebeat.com/wp-content/uploads/2025/02/GjCemCUW4AEUCHT.jpg?w=800)
Logan Kilpatrick yang paling menonjol adalah kemampuan untuk menanggung biaya dan nilai model, Ingat di x: “Gemini 2.0 Flash adalah pilar berharga terbaik untuk setiap LLM, saatnya untuk membangun!”
Faktanya, dibandingkan dengan LLM tradisional lainnya yang tersedia melalui antarmuka aplikasi penyedia, seperti Openai 4o-Mini (0,15 dolar/0,6 dolar per juta kode di/luar), Claude al -bushra (0,8 dolar/4 dolar! Per 1 meter di/luar) dan bahkan Deepseek LLM V3 tradisional ($ 0,14/0,28 dolar), di Gemini 2.0 Winf Flash adalah keributan terbaik untuk hal.
Gemini 2.0 Pro mencapai ketersediaan eksperimental dengan jendela konteks simbolik 2 juta
Untuk pengguna yang membutuhkan kemampuan kecerdasan buatan yang lebih maju, model Gemini 2.0 Pro (eksperimental) sekarang tersedia.
Google DeepMind menggambarkan ini sebagai model terkuatnya untuk pengkodean dan kemampuan untuk menangani klaim kompleks. Ini ditandai dengan jendela 2 juta orang dan kemampuan berpikir yang lebih baik, dengan kemampuan untuk mengintegrasikan alat eksternal seperti pencarian Google dan implementasi instruksi perangkat lunak.
Sam Witteveen, co -founder dan CEO Red Dragon AI dan ahli pengembang Google eksternal untuk pembelajaran otomatis yang sering berbagi ventureBeat, Diskusikan Model Profesional dalam Ulasan YouTube. “Gemini 2.0 Pro baru memiliki jendela jutaan juta, dan mendukung alat, mengimplementasikan kode, koneksi pekerjaan dan dasar dengan pencarian Google-semua yang kami miliki di Pro 1.5, tetapi telah ditingkatkan.”
Dia juga menunjuk pendekatan pengulangan Google untuk pengembangan kecerdasan buatan: “Salah satu perbedaan utama dalam strategi Google adalah bahwa ia mengeluarkan versi model eksperimental sebelum mereka mencapai GA (dapat diakses secara umum), yang memungkinkan pengulangan yang cepat berdasarkan berdasarkan berdasarkan Komentar. “
Standar kinerja juga menunjukkan kemampuan keluarga Gemini 2.0 keluarga. Gemini 2.0 Pro, misalnya, mengungguli flash dan flash melalui tugas -tugas seperti berpikir, pemahaman multi -bahasa dan konteks tinggi.
![](https://venturebeat.com/wp-content/uploads/2025/02/image6.original_JY99INi-1.png?w=512)
Keamanan Kecerdasan Buatan dan Perkembangan Masa Depan
Selain pembaruan ini, Google DeepMind menerapkan langkah -langkah keselamatan dan keselamatan baru untuk model Gueini 2.0 -nya. Perusahaan mengambil keuntungan dari teknik pembelajaran penguatan untuk meningkatkan akurasi respons, menggunakan kecerdasan buatan untuk mengkritik dan memperbaiki outputnya sendiri. Selain itu, tes keamanan otomatis digunakan untuk menentukan kelemahan, termasuk ancaman injeksi tidak langsung.
Di masa depan, Google DeepMind berencana untuk memperluas kemampuan keluarga model Gemini 2.0, dengan metode tambahan yang melebihi teks secara umum dalam beberapa bulan mendatang.
Melalui pembaruan ini, Google meningkatkan promosi untuk mengembangkan kecerdasan buatan, karena menawarkan serangkaian model yang dirancang untuk efisiensi dan kemampuan untuk menanggung biaya dan menyelesaikan masalah canggih, dan menanggapi kenaikan. Sedikit lebih sedikit (tetapi masih sebagian besar) dengan harga yang wajar.
Apakah ini akan cukup untuk membantu Google makan di beberapa pasar perusahaan AI, yang pernah didominasi oleh Openai dan sekarang oleh Deepseek? Kami akan terus melacak dan mengajari Anda!