Bergabunglah dengan buletin harian dan mingguan untuk mendapatkan pembaruan terbaru dan konten eksklusif untuk meliput kecerdasan buatan terkemuka di industri ini. Pelajari lebih lanjut


AI yang didanai Prancis mulai kesalahan Itu adalah konten yang harus dilakukan dengan caranya sendiri.

Dalam lautan model berpikir yang bersaing, perusahaan disajikan OCR burukDan Application Programming Interface (OCR) baru dirancang untuk memberikan kemungkinan pemahaman dokumen canggih.

API mengekstrak konten – termasuk catatan tulisan tangan, teks tertulis, foto, tabel dan persamaan – dari PDF yang tidak terorganisir dan gambar -gambar presisi tinggi, dan disajikan dalam koordinasi terorganisir.

Data struktural adalah informasi yang disusun terlebih dahulu sebelumnya, baris dan kolom biasanya digunakan, membuatnya mudah untuk mencari dan menganalisis. Contoh umum termasuk nama, alamat dan transaksi keuangan yang disimpan dalam database atau database.

Sebaliknya, data yang tidak terstruktur tidak memiliki format atau struktur tertentu, yang membuatnya sulit untuk diproses dan dianalisis. Kategori ini mencakup berbagai jenis data, seperti email, media sosial, video, foto, dan file audio. Karena data yang tidak terstruktur tidak cocok untuk database tradisional, dan alat dan teknologi khusus, seperti pemrosesan bahasa alami (NLP) dan pembelajaran mesin (ML), sering digunakan untuk mengekstraksi visi yang bermakna.

Memahami jenis data ini sangat penting bagi perusahaan yang ingin mengelola aset informasi secara efektif.

Dengan dukungan multi -bahasa, kecepatan pemrosesan yang cepat dan integrasi dengan model bahasa besar (LLM) untuk memahami dokumen, OCR yang mual ditempatkan untuk membantu organisasi membuat dokumen mereka siap.

Mengingat bahwa – menurut Mistral Post Post, yang mengumumkan antarmuka pemrograman aplikasi baru – 90 % dari semua informasi komersial tidak terorganisir, antarmuka pemrograman aplikasi baru harus menjadi berkah besar bagi institusi yang berupaya memberi nomor data mereka dan mengklasifikasikannya untuk digunakan dalam aplikasi kecerdasan buatan atau aturan pengetahuan internal/eksternal.

Mistral menetapkan standar emas baru untuk OCR

Mistral OCR bertujuan untuk meningkatkan bagaimana institusi memproses dan menganalisis dokumen yang kompleks.

Tidak seperti solusi OCR tradisional yang berfokus terutama pada ekstraksi teks, Mistral OCR dirancang untuk menjelaskan berbagai elemen dan huruf tipografi, termasuk tabel, ekspresi matematika dan gambar yang saling terkait, sambil mempertahankan output terstruktur.

Menurut Mistral Guillaume Lample, teknologi ini merupakan langkah penting untuk mengadopsi kecerdasan buatan yang lebih luas di lembaga -lembaga, terutama bagi perusahaan yang berupaya menyederhanakan akses ke dokumen internal mereka.

Antarmuka pemrograman aplikasi telah digabungkan ke dalam Le Cat, di mana jutaan pengguna bergantung pada dokumen memproses.

Sekarang, pengembang dan perusahaan dapat mengakses model melalui La Platiforme, pengembang Mistral.

Antarmuka pemrograman aplikasi diharapkan juga tersedia melalui mitra cloud dan inferensi dan akan memberikan publikasi lokal lembaga dengan persyaratan keamanan tinggi.

Kemajuan dalam Teknologi Komputasi Awal (70 tahun)

Teknologi OCR memainkan peran penting dalam mengotomatisasi ekstraksi dan dokumen data selama beberapa dekade. Mesin OCR komersial pertama dikembangkan pada tahun lima puluhan oleh David Shipbard dan rekan -rekannya Harvey dan William Lux Junior, yang mendirikan Smart Machinery Research Company (IMR) untuk menyediakan teknologi ke pasar.

Sistem ini mendapatkan traksi ketika Digest’s Digest menjadi agen utama pertamanya, diikuti oleh bank dan perusahaan telekomunikasi seperti AT&T dan perusahaan minyak besar.

Pada tahun 1959, paten IMR berlisensi IBM dan menyediakan mesin pengenalan optik pada surat -suratnya, menunjukkan istilah tersebut sebagai standar industri.

Sejak itu, teknik fotosintesis pada surat -surat terus berkembang, karena menggabungkan AI dan ML untuk meningkatkan akurasi dan memperluas dukungan bahasa dan menangani format dokumen Adobe Acrobat.

OCR Mistral mewakili langkah selanjutnya dalam pengembangan ini, karena meningkatkan Amnesty International untuk meningkatkan pemahaman dokumen di luar mengidentifikasi teks sederhana.

Kriteria menampilkan kekuatan OCR yang salah

Mistral menyoroti keuntungan bersaing dengan OCR pada alat saat ini, mengutip tes standar karena mengungguli alternatif utama termasuk Google Document AI, Azure OCR dan Openai GPT-4O.

Model ini telah mencapai akurasi tertinggi dalam mengidentifikasi matematika dan memindai dokumen dan memproses teks multi -bahasa.

Mistral OCR juga dirancang untuk bekerja lebih cepat daripada model yang bersaing dan mampu memproses hingga 2000 halaman per menit dengan satu simpul.

Fitur kecepatan ini membuatnya cocok untuk memperlakukan dokumen berukuran besar di industri seperti penelitian, layanan pelanggan dan konservasi historis.

Sofia Yang, kepala hubungan pengembang di Mistral, adalah Aktif Kemampuan OCR di akun X -nya. Perlu dicatat, menyoroti standar kinerja yang lebih tinggi, dukungan multi -bahasa dan kemampuan untuk mengekstraksi persamaan matematika secara akurat dari PDF.

di dalam Pekerjaan modernDia berpartisipasi dalam contoh ekspresi matematika yang kompleks dalam ekspresi matematika yang kompleks dan berhasil mengoordinasikannya, yang meningkatkan efektivitasnya untuk aplikasi ilmiah dan akademik.

Fitur utama dan kasus penggunaan

Mistral OCR menawarkan banyak fitur yang menjadikannya alat multi -guna untuk perusahaan dan lembaga yang menangani gudang dokumen besar:

  • Pemrosesan multi -bahasa: Model ini mendukung berbagai bahasa, program tekstual dan tata letak dokumen, menjadikannya berguna untuk lembaga internasional. Yang menekankan kemungkinan ini, menggambarkannya sebagai perubahan dalam permainan dokumen multi -bahasa.
  • Output struktural dan hierarki dokumen: Tidak seperti model pengetahuan optik dasar, OCR Mistral mempertahankan elemen koordinasi seperti kepala, vertebra, menu dan tabel, dan memastikan bahwa teks yang diekstraksi lebih berguna untuk aplikasi muara.
  • Dokumen tersebut seperti mengarahkan output terstrukturPengguna dapat mengekstrak dan mengoordinasikan konten spesifik dalam output terstruktur, seperti JSON atau Markdown, yang memungkinkan integrasi dengan tugas alur kerja lain yang bergantung pada AI.
  • Opsi Hosting -DiriLembaga dengan persyaratan keamanan data yang ketat dan kepatuhan dapat menyebarkan OCR yang salah dalam infrastruktur mereka.

Pengembang Kecerdasan Buatan Dokumen online Ini juga menyoroti kemungkinan memahami dokumen yang melebihi OCR. Setelah mengekstraksi teks dan struktur, OCR Mistral diintegrasikan dengan LLM, memungkinkan pengguna untuk berinteraksi dengan konten dokumen menggunakan kueri bahasa alami. Fitur ini memungkinkan:

  • Menjawab pertanyaan untuk konten dokumen tertentu;
  • Mengekstraksi informasi dan ringkasan otomatis;
  • Analisis komparatif melalui banyak dokumen;
  • Respons terhadap konteks yang melihat dokumen lengkap.

Apa yang harus diketahui oleh pembuat keputusan di lembaga tentang kesalahan OCR

Untuk eksekutif, manajer layanan, manajer CTO, manajer teknologi informasi dan pemimpin tim, Mistral OCR menawarkan peluang besar untuk efisiensi, keamanan dan perluasan alur kerja berbasis dokumen.

1. Meningkatkan efisiensi dan menghemat biaya

Dengan mengotomatisasi dokumen yang memproses dan mengurangi entri data manual, OCR mengurangi proses administrasi dan menyederhanakan operasi. Organisasi dapat memproses sejumlah besar dokumen lebih cepat dan lebih tinggi, yang mengurangi kebutuhan untuk intervensi manusia. Ini adalah nilai khusus untuk industri seperti keuangan, perawatan kesehatan dan hukum dan kepatuhan, di mana daun lebar adalah hambatan.

2. Meningkatkan Keputusan -Pembuatan dengan Visi AI

Kemampuan pemahaman Mistral OCR memungkinkan para pembuat keputusan untuk mengekstraksi visi laporan, kontrak, dokumen keuangan, dan makalah penelitian yang dapat diterapkan. Para pemimpin TI dapat mengintegrasikan antarmuka pemrograman aplikasi ke dalam platform intelijen bisnis, yang memungkinkan analisis dokumen dengan bantuan AI yang mendukung keputusan lebih cepat tergantung data.

3. Meningkatkan keamanan dan kepatuhan data

Melalui opsi penerbitan lokal, Mistral OCR memenuhi kebutuhan keselamatan dan kepatuhan untuk lembaga yang menangani data sensitif atau rahasia. Pusat koordinasi genital dan karyawan kepatuhan dapat memastikan bahwa informasi kepemilikan tetap berada dalam infrastruktur internal sambil mengambil keuntungan dari kecerdasan buatan untuk memproses dokumen.

4. Integrasi yang lancar dengan fungsi institusi

Manajer CTO dan Teknologi Informasi dapat mengintegrasikan OCR Mistral dengan sistem lembaga saat ini, termasuk platform manajemen konten, program CRM, solusi teknologi hukum, dan asisten intelijen buatan. Aplikasi antarmuka pemrograman aplikasi untuk output struktural (JSON, marmdown) memudahkan untuk mengotomatisasi alur kerja berbasis dokumen, yang meningkatkan total produktivitas.

5. Keunggulan kompetitif melalui inovasi yang digerakkan oleh kecerdasan buatan

Untuk institusi yang berharap dapat tetap dalam transformasi digital, Mistral OCR menawarkan solusi perkembangan kecerdasan buatan untuk membuat gudang dokumenter yang luas lebih mudah. Dengan memanfaatkan kecerdasan buatan untuk mengekstraksi informasi, lembaga dapat meningkatkan pengalaman pelanggan, meningkatkan aturan pengetahuan internal dan mengurangi inefisiensi operasional.

Harga dan ketersediaan

OCR Mistral dihargai 1000 halaman per satu dolar, dengan dimasukkannya pembayaran yang menawarkan 2000 halaman per satu dolar.

Antarmuka pemrograman aplikasi sekarang tersedia di LA Platforme, Mistral berencana untuk memperluas mitra cloud dan inferensi dalam waktu dekat. Model ini juga gratis dalam pengalaman Mistral KucingCHATBOT Conversation didukung oleh LLMS, mirip dengan dan bersaing ChatGPT dari OpenAI, yang memungkinkan pengguna untuk menguji kemampuannya sebelum menggabungkannya dalam alur kerja mereka. Mistral AI mengharapkan perbaikan berkelanjutan pada model berdasarkan catatan pengguna dalam beberapa minggu mendatang.

Ketika saya menguji waktu yang singkat dengan catatan tulisan tangan pendek (dan kacau) pada secarik kertas, saya menyajikan garis teks yang halus dan terorganisir dalam waktu kurang dari satu detik.

Apa selanjutnya?

Dengan Mistral OCR, Mistral AI terus memperluas sayap alat yang didorong oleh kecerdasan buatan, institusi penargetan yang membutuhkan solusi pemrosesan dokumen berkinerja tinggi.

Dengan mengintegrasikan OCR dengan pemahaman dokumen yang bekerja dengan bahan kecerdasan buatan, Mistral memungkinkan perusahaan untuk mengekstrak dan berinteraksi dengan mereka dengan cara yang lebih cerdas.

Para pemimpin lembaga, pengembang, dan tim teknologi informasi dapat menjelajahi OCR Mistral melalui La Platiforme atau permintaan penerbitan lokal untuk kasus penggunaan khusus.

Pengembang juga dapat memeriksa Dokumentasi kecerdasan buatan yang buruk Untuk mulai dengan mistral-arest.


Tautan sumber

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini