Statistik 101- Bagian 2- Distribusi Probabilitas, Jenis, dan… – Menuju AI

Statistik 101- Bagian 2- Distribusi Probabilitas, Jenis, dan… – Menuju AI

Pengarang: Kumar kaushal

Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.

Definisi distribusi probabilitas, berbagai jenis distribusi, penjelasannya, dan aplikasinya

Foto oleh Naser Tamimi di Unsplash

Artikel ini merupakan lanjutan dari artikel Statistik 101-Bagian 1. Di sini, kita akan membahas distribusi probabilitas, jenisnya, dan aplikasinya. Distribusi probabilitas adalah blok pembangun keputusan bisnis berdasarkan analisis statistik, pembelajaran mesin, dan lainnya. Oleh karena itu, memahami konsep yang berkaitan dengan distribusi probabilitas sangat penting.

Isi

Definisi distribusi probabilitas dan konsep penting Jenis distribusi probabilitas Memilih distribusi yang tepat Aplikasi

Definisi distribusi probabilitas dan konsep penting

Distribusi probabilitas berhubungan dengan distribusi frekuensi. Ketika benar-benar melakukan eksperimen dan mengamati frekuensi dari semua hasil, itu disebut distribusi frekuensi. Sedangkan, ketika kita membuat daftar probabilitas dari semua kemungkinan hasil yang dapat terjadi jika eksperimen dilakukan, itu disebut distribusi probabilitas.

mari kita misalkan bahwa kita memiliki sejumlah cacat dan kemungkinan terjadinya mereka dicatat seperti yang ditunjukkan pada tabel di bawah ini:

Gambar oleh penulis

Distribusi probabilitas dari contoh di atas akan seperti yang ditunjukkan di sini:

Gambar oleh penulis

Konsep penting lainnya yang perlu diketahui adalah Variabel Acak. Variabel acak adalah variabel yang diberi nilai yang berbeda berdasarkan percobaan acak. Itu berubah dari kejadian ke kejadian tanpa pola yang bisa diprediksi.

Jenis distribusi probabilitas

Kita dapat secara luas mengklasifikasikan distribusi probabilitas menjadi dua kategori- distribusi probabilitas diskrit dan distribusi probabilitas kontinu.

Distribusi probabilitas diskrit

Jika kita mempertimbangkan variabel diskrit dalam distribusi probabilitas, maka itu akan menjadi distribusi probabilitas diskrit, dan nilai yang diambil hanya beberapa nilai yang mungkin. Sebagai contoh, peluang hasil sebuah angka dalam sebuah dadu akan menjadi peluang diskrit karena hasil hanya dapat memiliki enam nilai yang mungkin. Fungsi yang mendefinisikan distribusi probabilitas diskrit disebut Fungsi Massa Probabilitas (PMF).

Distribusi Binomial adalah contoh distribusi probabilitas diskrit untuk variabel acak diskrit. Ini didefinisikan seperti yang ditunjukkan di bawah ini:

Gambar oleh penulis

di mana p=probabilitas keberhasilan, q=1-p=probabilitas kegagalan, r = jumlah keberhasilan yang diperlukan, dan n= jumlah percobaan. Kondisi untuk menggunakan distribusi Binomial disebutkan di bawah ini:

Setiap percobaan seharusnya hanya memiliki dua hasil ( contoh- ya atau tidak, lulus atau gagal) Probabilitas hasil percobaan tetap konstan dari waktu ke waktu. Misalnya, probabilitas sebuah kepala dalam lemparan koin yang adil akan konstan, yaitu, 0,5 Percobaan independen satu sama lain, yaitu, hasil percobaan tidak akan tergantung pada hasil percobaan lain.

Distribusi probabilitas diskrit lain yang terkenal adalah distribusi Poisson. Distribusi ini didefinisikan sesuai persamaan di bawah ini:

Gambar oleh Penulis

di mana lambda = rata-rata jumlah kemunculan per interval

Jika kita tertarik untuk mengetahui probabilitas kemunculan x, kondisi di bawah ini harus dipenuhi dalam kasus distribusi Poisson:

Probabilitas tepat satu kejadian dalam satu interval adalah angka yang sangat kecil dan konstan Probabilitas dua atau lebih kejadian dalam satu interval dapat diberi nilai nol Jumlah kejadian per interval tidak tergantung waktu Jumlah kejadian per interval adalah independen dari jumlah kejadian dalam interval waktu lain.

Contoh lain dari distribusi peluang diskrit adalah distribusi seragam diskrit.

Distribusi probabilitas berkelanjutan

Variabel yang dipertimbangkan dalam distribusi probabilitas kontinu dapat mengambil nilai apa pun dalam rentang nilai. Misalnya, distribusi probabilitas ketinggian populasi suatu wilayah akan menjadi distribusi probabilitas kontinu, karena ketinggian seseorang dapat mengambil nilai berapa pun.

Sebuah fungsi yang mendefinisikan distribusi probabilitas kontinu disebut Probability Density Function (PDF). Distribusi probabilitas kontinu yang diketahui dengan baik adalah distribusi Gaussian, juga disebut sebagai distribusi Normal.

Gambar oleh penulis
Representasi Distribusi Normal ( Gambar oleh penulis)

Distribusi normal harus memiliki ciri-ciri sebagai berikut:

Distribusi harus unimodal yaitu, harus hanya memiliki satu puncak Rata-rata untuk kurva harus berpusat Rata-rata harus sama dengan modus dan median Kedua ekor distribusi harus memanjang tanpa batas dan tidak pernah menyentuh sumbu horizontal

Distribusi eksponensial didefinisikan sesuai persamaan di bawah ini:

Gambar oleh penulis

di mana lambda disebut parameter laju

Contoh distribusi eksponensial (gambar oleh penulis)

Pada artikel pertama dari seri ini, kita telah melihat kasus distribusi t, juga dikenal sebagai distribusi Student. Distribusi ini digunakan dalam kasus di mana ukuran sampel kurang dari 30, dan simpangan baku populasi tidak diketahui. Seperti distribusi normal, distribusi ini juga simetris tetapi sedikit lebih datar dari distribusi normal. Ada distribusi t yang berbeda untuk setiap ukuran sampel yang mungkin, tergantung pada derajat kebebasannya. Semakin besar ukuran sampel, semakin mendekati distribusi normal.

Contoh distribusi peluang kontinu lainnya adalah log-normal, seragam kontinu, distribusi Chi-Square, dan lain-lain.

Memilih distribusi yang tepat

Sangat penting bahwa distribusi yang tepat dipilih untuk aplikasi. Kita harus dapat mengkategorikan jika distribusi yang akan digunakan adalah diskrit atau kontinu dan, selanjutnya, jika kondisi untuk distribusi tertentu terpenuhi. Misalnya, untuk dapat menggunakan distribusi Binomial, kondisi yang tercantum di bagian “jenis distribusi probabilitas- Distribusi probabilitas diskrit” harus dipenuhi. Demikian pula, jika kita ingin menggunakan distribusi normal, kondisi untuk distribusi tersebut harus dipenuhi.

Aplikasi

Distribusi probabilitas banyak digunakan dalam berbagai aplikasi. Kita harus memahami use case dan kondisi yang berlaku untuk menerapkan distribusi tertentu dan sampai pada probabilitas suatu peristiwa yang menarik.

Jika seorang manajer bisnis mencoba untuk memperkirakan probabilitas x jumlah cacat dari kumpulan n komponen, ini mungkin merupakan kasus penggunaan distribusi Binomial.

Jika manajer klinik ingin menghitung jumlah kedatangan pasien dalam sehari, distribusi Poisson dapat digunakan untuk kasus ini.

Distribusi pendapatan suatu negara dapat direpresentasikan sebagai distribusi normal, asalkan memenuhi persyaratan yang dipersyaratkan.

Kita dapat menggunakan distribusi Chi-Square dalam skenario di mana kita ingin menguji independensi dua parameter, seperti status perkawinan dan tingkat pendidikan, atau jenis kelamin dan gaji.

Oleh karena itu, ada banyak contoh untuk menunjukkan bahwa distribusi probabilitas dapat diterapkan untuk penggunaan tertentu.

Ikuti saya (kumarkaushal.bit) untuk topik menarik lainnya terkait Ilmu Data dan Statistik.

Statistik 101- Bagian 2- Distribusi Probabilitas, Jenis, dan Aplikasi awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Jeffrey Hayes