Dipsec mengejutkan semua orang bulan lalu bahwa model AI -nya menggunakan sekitar sepuluh -ketiga kekuatan komputasi sebagai model meta lamama 4.1, mendorong seluruh percakapan duniawi untuk mengembangkan kecerdasan buatan dan berkembang.
Mengambil harga wajah, klaim ini dapat berdampak besar pada dampak lingkungan AI. Raksasa teknologi terburu -buru untuk membangun pusat data AI yang sangat besar, beberapa memiliki rencana untuk menggunakan lebih banyak listrik untuk beberapa orang Sebagai kota kecilItu Sejumlah besar listrik menghasilkan polusi, bagaimana infrastruktur fisik dapat meningkatkan perubahan iklim oleh peralatan AI bawah tanah dan meningkatkan ketakutan akan kualitas udara.
Mengurangi kekuatan model AI generator dapat mengurangi sebagian besar tekanan yang diperlukan untuk berjalan dan beroperasi. Namun, ketika masalah jejak lingkungan AI datang, masih akan segera menebak apakah wakil game-changer akan. Banyak yang akan tergantung pada bagaimana pemain utama lainnya menanggapi terobosan startup Cina, terutama bagaimana bereaksi terhadap rencana untuk membuat pusat data baru.
“Ada pilihan subjek.”
“Itu hanya menunjukkan bahwa kekuatan AI seharusnya tidak menjadi babi,” kata Madala SinghSeorang peneliti postdotural di University of California, Santa Barbara, yang mempelajari sistem energi. “Ada pilihan subjek.”
Depsec dimulai dengan publikasi model V3 -nya pada bulan Desember, yang pelatihan terakhirnya hanya $ 5,6 juta dan 2,78 juta jam GPU yang dihabiskan untuk chip H 800 lama Nvedia, menurut ini Laporan Teknis Dari agensi. Sebagai perbandingan, Mater Lama 3.1 405b Model – juga menggunakan chip H1 100 baru yang lebih terampil – telah mengambilnya 30,8 juta jam GPU Pelatihan. (Kami tidak tahu biaya yang tepat, tetapi perkiraan LAMA 3.1 405B hampir $ 60 juta Dan juta untuk model komparatif antara 100 juta hingga $ 1 miliar))
Kemudian Depsec menerbitkan model R1 -nya minggu lalu, yang menyebut Kapitalis Mark Andresen dari Inisiatif “Hadiah yang mendalam di duniaItu “Asisten AI agensi cepat Atas Apple dan toko aplikasi Google. Dan pada hari Senin, itu dikirim ke hidung harga saham kontestan untuk berasumsi bahwa Depsec dapat membuat alternatif untuk Lama, Gemi, dan Chatzpt untuk sebagian kecil dari anggaran. Nvidia, yang chipnya memungkinkan semua teknologi ini, menemukan harga bagiannya dalam berita bahwa berita hanya membutuhkan 2.000 chip untuk pelatihan di Depsec V3 Membutuhkan 16.000 chip atau lebih oleh pesaingItu
Dipsec mengatakan bahwa menggunakan metode pelatihan yang lebih terampil dapat mengurangi berapa banyak listrik yang digunakannya. Dalam bahasa teknis, ia menggunakan a BantuanItu Singh mengatakan bahwa itu telah menjadi lebih pemilihan dengan bagian -bagian model yang dilatih; Anda tidak perlu melatih seluruh model secara bersamaan. Jika Anda menganggap model AI sebagai perusahaan layanan pelanggan besar dengan banyak ahli, Singh mengatakan lebih pemilih untuk memilih apa yang perlu diadapkan oleh para ahli.
Model ini juga menghemat energi dalam hal asumsi, yaitu hanya ketika model benar -benar diberi tanggung jawab melakukan sesuatu, yang disebut Menangkap Nilai Asli Dan kontraksi. Jika Anda menulis cerita yang memerlukan penelitian, Anda mungkin menganggap metode ini sebagai referensi ke kartu indeks dengan ringkasan tingkat tinggi, karena Anda menulis seluruh laporan yang telah Anda singkat, Singh menjelaskan.
Fakta bahwa Singh sangat optimis adalah bahwa model Diploma sebagian besar open source, data pelatihan. Dengan metode ini, para peneliti dapat belajar dengan cepat dari satu sama lain dan membuka pintu untuk memasuki industri pemain kecil. Ini juga menentukan lebih banyak transparansi dan akuntabilitas, sehingga investor dan pelanggan dapat lebih mengkritik sumber daya yang mereka ambil untuk mengembangkan model.
Ada pedang yang disimpan ganda untuk dipertimbangkan
Singh berkata, “Jika kami telah menunjukkan bahwa kapasitas AI tingkat lanjut ini tidak memerlukan sumber daya yang begitu besar, itu akan membuka rumah pernapasan untuk rencana infrastruktur yang lebih berkelanjutan,” kata Sing. “Ini masih dapat mendorong laboratorium AI yang sudah mapan ini, seperti AI terbuka, etnis, Google Gemssi, algoritma dan teknik yang lebih efisien untuk mengembangkan dan menambahkan lebih banyak data dan komputasi energi ke model -model ini.”
Untuk dikonfirmasi, masih ada keraguan di sekitar Dipsec. “Kami telah menggali DEP, tetapi sulit untuk menemukan pandangan tentang konsumsi energi program,” Carlos Torres Diaz, kepala energi yang dipulihkan, mengatakan dalam email.
Torres Diaz menulis bahwa jika perusahaan mengklaim menggunakan kekuatannya benar, ia dapat memangkas konsumsi energi total pusat data. Dan ketika perusahaan teknologi besar telah menandatangani kebocoran kesepakatan untuk mengumpulkan energi terbarukan, meningkatkan permintaan listrik dari pusat data masih terbatas matahari untuk jaringan listrik dan risiko terhadap sumber daya udara. Menurut Torres Diaz, pengurangan biaya listrik AI “sebagai hasilnya akan memberikan lebih banyak energi terbarukan untuk sektor lain, membantu dengan cepat menggantikan penggunaan bahan bakar fosil.” “Secara keseluruhan, permintaan listrik rendah dari sektor mana pun bermanfaat untuk perubahan energi global karena diperlukan pembangkit listrik bahan bakar fosil yang lebih sedikit.”
Ada pedang usia ganda yang perlu dipertimbangkan dengan lebih banyak model AI energi-selatan. CEO Microsoft adalah Nadella sejati Menulis x Tentang paradoks Zovons, di mana teknologi menjadi lebih efisien, semakin besar kemungkinannya untuk digunakan. Efisiensi meningkatkan kerusakan lingkungan.
“Pertanyaannya adalah, G, jika kita dapat menghilangkan penggunaan AI dengan faktor 1, itu berarti bahwa pemasok 1000 data akan datang ke sini dan berkata, ‘Wow, itu bagus. Kami akan membangun, membangun, membangun seribu kali sesuai rencana yang kami rencanakan? “Philip Carin mengatakan Illinois adalah profesor riset teknik listrik dan komputer di juara Universitas Urbana. “. Membuat
Penting untuk melihat di mana pusat data menggunakan berapa banyak listrik yang tidak digunakan, berapa banyak polusi yang diciptakannya. China masih mendapatkan Lebih dari 60 persen listriknya dari batubaraDan yang lain 3 persen Berasal dari gas. AS juga berkeliling 60 persen listriknya dari bahan bakar fosilNamun sebagian besar berasal dari gas – yang Dengan membuat kontaminasi karbon dioksida rendah Saat terbakar dari batubara.
Untuk memperburuk masalah, agen energi Keterlambatan pensiun pembangkit listrik bahan bakar fosil di Amerika Serikat untuk memenuhi permintaan yang disentuh langit dari pusat dataItu Sesuatu bahkan direncanakan Buat tanaman gas baruItu Pembakaran lebih banyak bahan bakar fosil pasti menyebabkan lebih banyak polusi yang menyebabkan penyebab perubahan iklim Pollutter Udara Yang meningkatkan risiko kesehatan bagi masyarakat di sekitarnya. Pusat data Banyak air untuk pergi Untuk melindungi perangkat keras dari panas berlebih, yang dapat menyebabkan stres lebih lanjut di wilayah rawan kekeringan.
Ini adalah semua masalah yang dapat dikurangi pengembang AI dengan membatasi penggunaan energi secara keseluruhan. Dition telah mampu melakukan ini di masa lalu di masa lalu. Meskipun hampir tiga kali lipat stres kerja antara 2015 dan 2019, permintaan listrik mampu tetap relatif datar selama periode itu, Menurut penelitian shutch GoldmanItu Kemudian pusat data meningkat lebih banyak penurunan energi sekitar tahun 2020 dengan kemajuan AI. Mereka mengkonsumsi lebih dari 4 persen listrik di Amerika Serikat pada tahun 2021, dan itu bisa berubah sekitar tiga kali menjadi 12 persen sekitar 2028, yang menurutnya Dilaporkan Desember Lawrence Berkeley dari Laboratorium Nasional. Ada lebih banyak ketidakpastian tentang jenis asumsi ini sekarang, tetapi pada saat ini setiap tembakan masih merupakan tembakan dalam gelap.