Apa hubungan antara Model Dunia, Kucing Schrödinger… – Menuju AI

Apa hubungan antara Model Dunia, Kucing Schrödinger… – Menuju AI

Pengarang: Alexander Kovalenko

Awalnya diterbitkan di Menuju AI.

Apa Hubungan Antara Model Dunia, Kucing Schrödinger, dan Jaringan Neural?

Menggunakan Jaringan Syaraf Informasi Fisika (PINN) untuk menyelesaikan Persamaan Schrödinger yang terkenal

sumber

Selama berabad-abad, pikiran yang ingin tahu telah mencoba memecahkan struktur dunia di sekitar kita. Sebagian besar akan setuju bahwa cabang sains mana pun mengikuti tujuan yang sama — mencoba memetakan fungsi ke pengamatan. Fungsi ini, yang entah bagaimana menjelaskan model dunia dengan perkiraan, dapat berupa kontinu atau diskrit dan dimaksudkan untuk menemukan korespondensi antara set input dan output.

Pencarian untuk fungsi yang mendeskripsikan model dunia dapat menjadi rumit tanpa pengetahuan sebelumnya. Namun, kita tahu bahwa dunia di sekitar kita itu kompleks dan dinamis. Model kompleks dapat diwakili oleh aturan sederhana, jadi mungkin ada walkaround. 😅 Namun demikian, karena segala sesuatu cenderung berkembang dalam ruang dan waktu, aspek dinamis dari dunia yang selalu berubah tidak dapat diabaikan begitu saja.

“Sesuatu hanya dapat dijelaskan dengan menerima sesuatu yang lain begitu saja”

Richard Feynmann

Dinamika dapat dijelaskan melalui turunan yang mengukur kepekaan keluaran fungsi sehubungan dengan perubahan masukan. Pada saat yang sama, hubungan antara fungsi dan turunannya didefinisikan dalam bentuk persamaan diferensial. Oleh karena itu, tidak perlu khawatir bahwa banyak fenomena dalam fisika, teknik, ekonomi, biologi, psikologi, dan yang lainnya dapat berhasil dimodelkan dengan menggunakan persamaan diferensial jenis apa pun. Persamaan diferensial dapat digunakan untuk menghitung pergerakan atau aliran listrik atau panas, pergerakan suatu benda, atau bahkan untuk memeriksa pertumbuhan penyakit. Tak perlu dikatakan, keseluruhan algoritma backpropagation dapat dilihat sebagai persamaan diferensial, di mana turunan parsial dari kesalahan dihitung sehubungan dengan bobot, menggunakan aturan rantai.

Di satu sisi, kami memiliki fungsi yang tidak diketahui; di sisi lain, turunannya mewakili laju perubahan. Persamaan diferensial mendefinisikan hubungan antara keduanya.

Meskipun banyak dari Anda mungkin mengenal Erwin Schrödinger melalui eksperimen pemikirannya yang sering disebut “Kucing Schrödinger”, dia dikenal sebagai salah satu bapak baptis di bidang teori kuantum. Schrödinger mendalilkan persamaan (yang sekarang disebut persamaan Schrödinger) yang mengatur fungsi gelombang sistem mekanika kuantum atau menjelaskan letak partikel kuantum.

Seseorang bahkan dapat membuat kasus yang cukup konyol. Seekor kucing dikurung di ruang baja, bersama dengan perangkat berikut (yang harus diamankan dari gangguan langsung oleh kucing): di pencacah Geiger, ada sedikit zat radioaktif, sangat kecil, yang mungkin ada di jalurnya dari jam salah satu atom meluruh, tetapi juga, dengan kemungkinan yang sama, mungkin tidak ada; jika itu terjadi, tabung penghitung melepaskan dan melalui relai melepaskan palu yang menghancurkan labu kecil asam hidrosianat. Jika seseorang membiarkan seluruh sistem ini sendirian selama satu jam, orang akan mengatakan kucing itu masih hidup jika sementara itu, tidak ada atom yang meluruh. Peluruhan atom pertama akan meracuninya. Fungsi psi dari seluruh sistem akan mengungkapkan hal ini dengan memasukkan kucing hidup dan mati (maaf untuk ungkapan) di dalamnya dicampur atau dioleskan di bagian yang sama.

Schrödinger, E. Situasi Saat Ini dalam Mekanika Kuantum. Naturwissenschaften 23, 807-812 (1935).

“Persamaan Schrödinger” adalah salah satu tonggak fundamental dalam memahami fisika kuantum dan membangun gambaran yang lebih jelas tentang model dunia. Dan coba tebak? Persamaan ini adalah persamaan diferensial parsial linier seperti yang ditunjukkan di bawah ini:

Di mana Ψ adalah fungsi gelombang yang tidak diketahui yang ingin kita temukan. Sebelum kita mulai, saya harus memberi tahu Anda bahwa ada banyak sekali kasus khusus persamaan Schrödinger meskipun banyak di antaranya sangat rumit, sehingga tidak dapat diselesaikan secara analitik untuk sebagian besar atom. Oleh karena itu, sekarang mari kita berkonsentrasi pada salah satu kasus paling sederhana, yaitu solusi “Persamaan Schrödinger” untuk “partikel-dalam-kotak”, yang merupakan demonstrasi bagus tentang perbedaan antara sistem klasik dan sistem kuantum.

Bayangkan, partikel kita terjebak di antara dua pembatas potensial tak terhingga (kasus ini kadang disebut sumur potensial tak terhingga). Partikel itu bebas bergerak di antara dinding. Karena ini adalah kasus yang sangat terbatas, pada kenyataannya, contoh mainan hipotetis, ada cara untuk menyederhanakan ekspresi awal kami, menghasilkan persamaan Schrödinger yang tidak bergantung waktu untuk satu partikel di dalam kotak:

Bagaimana kita melakukannya? Lihat video luar biasa di bawah ini yang menjelaskan cara menurunkan kasus tertentu untuk partikel dalam kotak dan menyelesaikannya secara analitik:

Namun demikian, kami berakhir dengan persamaan diferensial orde kedua. Fungsi Ψ ​​menggambarkan perilaku partikel. Posisi, momentum, dan energi dapat diturunkan dari Ψ. Jika Anda sudah menonton videonya, Anda sudah tahu cara mengatasinya. Namun, jika belum, sepertinya persamaan di atas tidak terlihat begitu rumit. Jadi apa masalahnya?!

Jika kita melihat lebih dekat, maka yang kita tahu adalah bahwa Ψ(0) = 0, Ψ(a) = 0, dan turunan kedua dari Ψ ditambah Ψ itu sendiri juga nol! Namun, kita tahu bahwa Ψ tidak nol dalam interval (0, a).

ಠ益ಠ

Oke, mari tarik semua pengetahuan yang kita miliki, kecuali persamaan itu sendiri, bersama-sama:

Ψ adalah fungsi? Ψ(0) = 0 Ψ(a) = 0

Karena Ψ adalah fungsi, dan kami adalah ilmuwan data, kami dapat memanfaatkan teorema aproksimasi universal, yang secara kasar menyatakan sebagai berikut:

Setelah jumlah neuron mencukupi, jaringan neural feedforward dengan fungsi aktivasi non-polinomial dapat memperkirakan setiap fungsi yang berperilaku baik dengan akurasi apa pun.

Teorema ini berlaku untuk jaringan saraf berlapis banyak dan satu lapisan tersembunyi, dan pada dasarnya untuk salah satu fungsi aktivasi modern (ReLU, GeLU, Sigmoid, Tanh, dll.). Sepertinya persis apa yang kita butuhkan!

Tidak… Tunggu… Bagaimana dengan datanya?!

Yah, kita tidak punya. Namun, ada jalan keluar yang disebut Physics Informed Neural Networks, atau PINN. PINN menarik perhatian khusus baru-baru ini, terutama karena kemampuannya untuk memodelkan dan memperkirakan dinamika multifisika dan sistem dunia nyata multiskala. Properti lain yang menarik dari PINN adalah bahwa jika kita menyesuaikan data yang harus mematuhi beberapa hukum fisik, dan kita mengetahui hukum ini, kita dapat dengan mudah menambahkan ketergantungan ini ke fungsi kerugian, yang membuat model pembelajaran mesin kita mematuhi hukum fisik, yaitu untuk menjadi fisika informasi.

Secara umum, terkait PINN, kami dapat menentukan tiga cara untuk melatih model secara efisien:

banyak data dan tidak ada fisika (apa yang kita semua kenal) sedikit data dan beberapa fisika tidak ada data dan semua fisika yang kita miliki

NB: Demi kesederhanaan, kita akan menghilangkan semua konstanta dalam persamaan. Kita asumsikan bahwa k=1, dan sumur kuantum kita dari 0 sampai a=10.

Kasus kami persis seperti yang ketiga. Kami memiliki hukum fisik untuk diikuti, tetapi tidak ada data. Mari kita definisikan syarat batas hanya sebagai fungsi yang mengembalikan nol:

Dan karena persamaan di atas tidak memiliki residu, yaitu semua suku yang mengandung Ψ berada di bagian kiri, kita dapat menentukan fungsi untuk persamaan Schrödinger kita. Sederhananya, itu akan menjadi sesuatu yang cenderung nol.

Kemudian, seperti yang dibahas di atas, persepsi multilayer dengan nonlinier non-polinomial harus menjadi pilihan yang baik untuk mendekati fungsi gelombang kita Ψ. Di sini kami menggunakan nonlinier Unit Linear Kesalahan Gaussian karena secara empiris ditemukan bekerja sedikit lebih baik daripada Sigmoid dan Tanh, sementara ReLU menunjukkan kinerja terburuk.

Konsekuensinya, kita harus membuat model kita menghormati persamaan Schrödinger, yang berarti harus mendapat informasi fisika. Ini dapat dicapai dengan mendefinisikan fungsi kerugian yang mencakup perbedaan dari seluruh persamaan diferensial dan perbedaan pada batas:

Perhatikan bahwa kita dapat menghitung gradien (atau hanya turunan dari fungsi Ψ ​​psi_x) dengan menggunakan torch.autograd.grad(), fungsi diferensiasi otomatis yang menghitung dan mengembalikan jumlah gradien output sehubungan dengan input. Untuk menghitung psi_xx turunan kedua, cukup gunakan fungsi grad() dua kali.

Oleh karena itu, kita dapat melewati batas pada dinding kotak dan titik data di dalam kotak untuk menghitung kerugian keseluruhan dan kemudian mempropagasi ulang kesalahan untuk memperbarui bobot.

Setelah beberapa ribu iterasi, kita bisa melihat hasilnya. Seperti ditunjukkan di bawah ini, output dari fungsi kita mirip dengan solusi untuk kasus partikel dalam kotak. Karena kita tahu bahwa solusi untuk persamaan Schrödinger sebenarnya adalah keluarga solusi, keluarannya dapat bervariasi pada inisialisasi bobot stokastik dan parameter pelatihan. Kode lengkap dapat ditemukan di sini.

Output PINN setelah 4500 iterasi

Tentu saja, ada banyak implementasi yang lebih canggih yang menunjukkan cara menyelesaikan persamaan Schrödinger menggunakan jaringan saraf yang dalam[1, 2, 3]. Di sisi lain, entri blog ini mendemonstrasikan pengenalan yang sederhana dan mudah dipahami tentang pembelajaran mesin berbasis fisika dan memberikan gambaran tentang kapan dan mengapa kami ingin “menginformasikan” model kami. Alasan saya memilih persamaan Schrödinger sederhana — karena persamaan itu sendiri dan kondisi batas cukup membatasi dan tidak terlalu informatif (seperti yang Anda ingat, angka nol ada di mana-mana). Algoritma penurunan gradien, dapat menemukan solusi bukan nol, meskipun tidak dihukum.

Akhirnya, kita dapat menjawab pertanyaan yang tertera pada judul postingan blog: “Apa hubungan antara World Model, Schrödinger’s Cat, dan Neural Network?”. Seperti yang kita ketahui, banyak proses dinamis yang menggambarkan model dunia dapat dimodelkan menggunakan persamaan diferensial. Di sisi lain, bahkan persamaan diferensial yang sangat rumit pun dapat diselesaikan dengan jaringan saraf berbasis fisika.

Apa hubungan antara World Model, Schrödinger’s Cat, dan Neural Network? awalnya diterbitkan di Menuju AI di Medium, di mana orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Jeffrey Hayes