Kami pertama kali mendengar tentang Katalog (terbuka di tab baru)pelopor penyimpanan data berbasis DNA pada Oktober 2020 dan melakukan wawancara dengan David Turek, CEO-nya dan alumni IBM.
Hampir setahun kemudian, mereka mengumumkan putaran Seri B senilai $35 juta, dipimpin oleh Hamwha Impact Partners dan berencana untuk meluncurkan platform komputasi berbasis bahan kimia pertama yang menggabungkan manajemen data (dan penyimpanan) dan komputasi melalui manipulasi DNA sintetik.
Oleh karena itu, waktu yang tepat untuk mengejar Katalog dan menempatkan CEO-nya, Taman Hyunjun, di kursi yang diwawancarai.
1. Jadi apa yang terbaru tentang Shannon? Apa yang terjadi sejak kami terakhir mewawancarai Dave Turek (CTO of Catalog)?
Selama setahun terakhir, CATALOG telah bekerja sama dengan beberapa perusahaan IT, Energi, dan Media dan Hiburan terkemuka dalam kolaborasi untuk membantu memajukan teknologi untuk komersialisasi. Melalui pekerjaan ini, CATALOG telah menemukan penerapan yang luas dari platform kami di seluruh sektor industri, serta permintaan yang hampir universal untuk apa yang dijanjikan oleh komputasi berbasis DNA di antara pengguna data berat. Aplikasi awal yang dapat kita bicarakan saat ini mencakup pemrosesan sinyal digital, seperti pemrosesan seismik di sektor energi, dan perbandingan basis data, seperti perlindungan penipuan dan manajemen identitas di industri keuangan.
2. Saat ini Shannon agak mirip dengan ENIAC pada generasinya: besar, lamban, mahal, terbatas, tetapi inovatif. Jika kita mempercepat ke tahun 2030; seperti apa tampilan Shannon v10?
Shannon membantu membuktikan bahwa proses otomatisasi dan penskalaan penyimpanan berbasis DNA dan kini komputasi berbasis DNA dapat dicapai. Untuk tujuan ini saja, penting untuk membangun Shannon. Saat kita bergerak satu dekade, versi teknologi masa depan akan lebih kecil dan lebih portabel, lebih cepat, dan lebih efisien. Dapat dibayangkan bahwa pada tahun 2030 Anda dapat melihat Shannon versi desktop dan ukuran saku tersedia dan menggunakan energi yang sangat kecil untuk penyimpanan dan komputasi.
3. DNA dalam komputasi biasanya dikaitkan dengan penyimpanan data. Katalog ingin membawa DNA ke dalam algoritme dan aplikasi? Tapi bagaimana caranya?
Yang kami maksud dengan komputasi dengan DNA adalah transformasi data yang dikodekan dalam DNA menjadi beberapa jenis informasi baru. Misalnya, jika saya memiliki file input dari dua angka besar, mengalikannya bersama-sama akan menghasilkan angka yang sebelumnya tidak ada dalam file—ini adalah informasi baru yang mewakili produk dari dua bagian data. Kami percaya bahwa kami dapat membuat satu set “instruksi” kimia yang dapat beroperasi pada data yang disandikan DNA untuk membuat informasi baru. Contohnya termasuk masalah dalam pengoptimalan (menemukan yang terbesar, terkecil, yang terbaik dari sesuatu di bidang keuangan, logistik, manufaktur), masalah dalam pemrosesan sinyal (diterapkan di area seperti pemrosesan seismik di industri minyak dan gas), dan masalah dalam menyimpulkan dan pembelajaran mesin untuk memulai. Keuntungan dengan DNA adalah kita dapat melakukan operasi ini pada tingkat paralelisme ekstrim yang berarti kita dapat menerapkan miliaran atau triliunan agen komputasi untuk bekerja secara kolektif guna memecahkan masalah yang dihadapi. Setiap agen komputasi (kemungkinan terdiri dari kumpulan molekul) akan relatif lemah sebagai mesin komputasi, tetapi peluang untuk menyatukan miliaran atau triliunan untuk menyelesaikan suatu masalah berpotensi secara dramatis mengurangi waktu untuk wawasan.
Dapat dibayangkan bahwa pada tahun 2030 Anda dapat melihat Shannon versi desktop dan ukuran saku tersedia dan menggunakan energi yang sangat kecil untuk penyimpanan dan komputasi.
CEO Katalog, Taman Hyunjun
Domain lain yang menarik bagi kami adalah pencarian. Kita dapat menggunakan instruksi kimiawi untuk dengan cepat menemukan objek data yang dikodekan ke dalam DNA terlepas dari volume data. Ini berarti bahwa seiring bertambahnya jumlah data yang kita cari, kita dapat menggunakan teknik pencarian kimiawi yang pada dasarnya tidak bergantung pada volume data—waktu penyelesaian akan tetap kurang lebih tidak berubah. Itu tidak terjadi di banyak aplikasi pencarian elektronik saat ini dan alasan perbedaannya adalah bahwa penyimpanan DNA adalah kumpulan molekul yang mengambang dalam cairan dan tidak bergantung pada jenis organisasi fisik yang ada dengan media elektronik: kartrid pita harus diperiksa secara serial karena begitulah secara fisik diatur (A mendahului B yang mendahului C dan seterusnya). Dalam file DNA, molekul-molekul semuanya bercampur aduk dalam cairan dan dapat dicari secara langsung. Ini mempersingkat waktu untuk wawasan dan mengurangi biaya.
4. Berita pendanaan Anda juga menyebutkan bahwa perhitungan berbasis DNA diharapkan pada tahun 2022? Apa artinya itu dan apakah itu akan tersedia lebih luas?
Pada tahun depan, CATALOG akan mendemonstrasikan nilai komputasi berbasis DNA melalui kasus penggunaan bisnis tertentu. Ini kemungkinan akan menunjukkan nilai bisnis dari menganalisis data yang sebelumnya tersimpan di cold storage di satu industri tertentu. Harapan kami adalah seiring berkembangnya kasus penggunaan, kami akan mengizinkan klien untuk mengakses teknologi kami melalui Web sebagai layanan (sekitar tahun 2024); kami juga mempertimbangkan kemungkinan untuk membuat perangkat miniatur yang mampu mengeksekusi komputasi di lokasi pelanggan di beberapa titik selanjutnya
5. Saat ini, sampel penyimpanan berbasis DNA terlihat seperti zat oranye di dalam tabung reaksi. Bentuk/ukuran apa yang akan diambil pada akhirnya?
Penyimpanan berbasis DNA adalah molekul DNA yang mengambang dalam cairan (oranye dalam kasus KATALOG karena komposisi tinta yang kami gunakan untuk menyandikan DNA) atau mungkin pelet DNA untuk penyimpanan jangka panjang. Ada manfaat besar untuk memiliki penyimpanan dalam bentuk cair karena ini menghadirkan peluang untuk menemukan “catatan” dalam file secara langsung: kita dapat membuat probe yang, setelah dimasukkan ke dalam file, akan menemukan catatan atau datum yang ditargetkan secara langsung.
6. Saya menanyakan Katalog satu pertanyaan tahun lalu dan itu adalah “berapa biayanya?” Apakah kita punya jawaban sekarang yang bisa kita bagikan? Kepadatan penyimpanan seperti apa yang kita lihat, dan berapa biaya per PB atau TB yang disimpan?
Opsi komersialisasi pertama untuk penyimpanan DNA, diikuti dengan komputasi berbasis DNA, kemungkinan akan diberikan sebagai layanan. Kami akan mengumumkan model penetapan harga sedikit lebih dekat dengan ketersediaan penawaran itu. Tujuannya adalah untuk menjadi kira-kira sama dengan penyimpanan konvensional tetapi untuk mengekspresikan nilai berdasarkan peningkatan dramatis dalam kepadatan areal (sejuta kali lebih padat dari media elektronik), umur panjang efektif tak terbatas, dan menghindari keusangan teknologi: DNA yang ditulis hari ini akan dapat dibaca kapan saja di masa mendatang karena DNA tidak berubah: tidak ada masalah seperti peningkatan firmware, OS, atau perangkat yang mengkhawatirkan.
7. Saat ini, apa hambatan terbesar untuk perkembangan pesat kemampuan penyimpanan/komputasi DNA dan apa yang sedang dilakukan untuk menyelesaikannya
Saat ini hambatannya bersifat rekayasa dan fokus pada hal-hal yang dianggap penting secara konsisten oleh klien sehubungan dengan teknologi komputasi apa pun: keandalan, kinerja harga, ketersediaan, konsistensi, dan sebagainya. Kami memiliki tim insinyur, ahli kimia, dan ilmuwan komputer yang berdedikasi untuk memilah setiap masalah ini untuk menciptakan jenis metrik nilai yang biasa digunakan klien. Ini termasuk miniaturisasi mesin saat ini, perluasan otomatisasi yang mencakup seluruh proses, dan desain serta implementasi infrastruktur dan perkakas perangkat lunak yang diinginkan oleh klien.
8. Apa solusi saat ini sedang dilihat untuk memecahkan masalah throughput (misalnya 10MBps tertulis hanya 26TB per bulan).
Atribut throughput Shannon saat ini dimaksudkan untuk membantu CATALOG lebih memahami dampak pembatasan pilihan desain yang kami buat pada mesin, termasuk implikasi penskalaan kimiawi yang mendasari model pengodean dan komputasi kami. Kami dapat menyesuaikan throughput dengan mengubah beberapa parameter kinerja pada sistem saat ini dan ini akan berdampak beberapa kali lipat. Tapi kami telah mulai mengeluarkan pilihan desain lain yang bisa jauh melampaui peningkatan itu. Misalnya, penambahan print head ink jet inkremental memiliki dampak eksponensial pada throughput mesin. Ini hanyalah salah satu contoh dari banyak penyesuaian atau pilihan desain yang tersedia bagi kami.