Halaman

Selasa, 22 Oktober 2024

Penganggar Saksama

0 comments

Bismillahirrahmanirrahiim. Dengan nama Allah yang Maha Pemurah lagi Maha Penyayang.

...

Dulu masa belajar Statistik 1 (basic, the most basic statistic.. 101), ada la satu topik ni. Penganggar. Atau omputihnya, Estimation Value.

Figure 113: Screenshot dari Buku Kerja Satistik (Modul Pengajaran), terbitan UTM, 2001.


So kononnya aku baca balik buku ni sebab (kononnya) nak polishkan balik foundation aku. But, I mean, yeah. The first paragraph tu nampak innocent sangat. Perenggan kedua dah mula kabur - kabur (what's with firasat on math). Perenggan ketiga, satu nombor tunggal katanya. Tapi dalam example - example lepas tu, semua anggaran titik tu adalah variable. Apakahhh

Terus terang aku cakap, sampai la ni aku kadang - kadang masih lagi confuse pasal Estimation Value ni.

But unbeknownst upon me, I'm actually using it a lot. I mean a lot - lot alot.

So let me try to break it down. The estimation value (titik penganggar) digunakan kalau kita tak boleh nak dapatkan anggaran populasi dari sedikit sampel yang kita ada.

In statistik, this is actually quite crucial. So contohnya aku nak ukur average petrol used untuk kereta kat Malaysia ni (usually measured in either Litre per 100 km or kilometer per Litre, in this example, kita guna L/100km).

I can say that, it is impossible untuk ambil data semua manusia di Malaysia ini dan dapatkan nilai L/100km kat kereta diorang.

So what statistician do, is to get the best estimator value, based on apa sample set yang ada. Ok remember that ayat, we will revise it later.

Sekarang ni, kalau aku pergi kat website data.gov.my (particularly at here), kita boleh nampak statistik pengeluaran kereta macam ni (top 10).

Figure 114: Pengeluar dan model kereta paling hangat pada 2024 (data sehingga 30 september 2024).. Gituu

So from here, aku boleh gunakan Top 10 ni untuk dapatkan average L/100KM dengan let say, 72 Perodua Bezza, 64 Perodua Axia, dan sebagainya.

Why Top 10? Hahah sebab data tu je yang aku jumpa. Malas nak carik lagi. But for the actual statistician, they can use any dimension reduction technique. So instead nak gunakan I think about more than 500 jenis/model kereta, they can just pick the one that is statistically significant.

Ok back to our story.

So basically dia ada cara kira dia nak dapatkan berapa enough sample size yang diperlukan.

From there, kita boleh dapatkan ESTIMATED value untuk penggunaan petrol untuk kereta di Malaysia.

Ok? Obviously the math is straight forward.

Let say \( E \left [ X \right ] \) is the estimated value, and \( X \) is the penggunaan petrol dalam unit L/100KM. So...

$$ E\left [ X \right ] = \frac{1}{n} \sum_{i=1}^{n} X_i $$

Easy actually.. kan?

And the standard deviation dia pula,

$$ s=\sqrt{ \frac{1}{n-1} \sum_{i=1}^{n} \left ( X_i - E \left [ X \right ] \right ) }  $$

But actually ni yang sebenarnya aku tak beberapa paham dulu. So the \( E \left [ X \right ] \) is actually the same calculation for average for population, or we call it as mean value, the \( \mu \).

Dan kalau untuk estimation, kita fancy kan \( \mu \) tu pakai topi, jadi \( \hat{\mu} \) (ingat tak, sebelum ni aku ada pernah citer pasal estimation value ni?) (also i kid you not, memang sebut \( \hat{\mu} \) ni sebagai miu hat.. haha)

But the equation is the same.

Yang beza kat standard deviation tu. Itu pon sebab,

  1. Simbol standard deviation untuk population ialah \( \sigma \) manakala untuk sample ialah \( s \).
  2. Dan untuk \( \left ( n - 1 \right ) \) pula adalah untuk correction jadikan dia unbiased. Panjang citer ni. Aku tak rasa aku akan cover ni sebab aku tak terer sangat macam mana proof dia.

Ok point no 2 tu, kita nak jadikan dia supaya unbiased sebab kita nak ianya berdekatan dengan nilai sebenar dia (remember we are still talking about estimator?).

 

Figure 115: Unbiased vs biased, imprecise vs precise [104]
 

 

So what actually make it different?

Data. Data aku collect dari sample, just a part of populasi.

Tujuan. Aku nak dapatkan anggaran without knowing the real value (of population).

But actually the most important part yang selalu kita terlupa (even in this post)... Is the total sample is enough to be estimator for the true population?

A.k.a, sampel kita tu cukup ke??

...

Ok some things happens for me in these several weeks.

Not one, not two, tapi quite numbers of people cakap kat aku, "Fairuz, you ni takde banyak kerja kan?"

I'm stunned.

Aku ni, nampak free sangat ke sampai orang ingat aku ni takde banyak kerja?

Ok I'm not saying that aku ni free je. But to be honest, kerja aku ni memang sampai tak cukup tangan. Sampai aku banyak pass kerje - kerje aku ke team member aku.

But I'm not the kind yang citer kat orang pasal aku buat itu, aku buat ini. Yang paragraph aku citer kat atas tu pon, cuma reader aku je yang baca (aku tak rasa budak office aku baca blog aku ni.. in fact, aku tak rasa ada orang pon baca blog aku ni lol).

Kadang - kadang aku terfikir juga, why did they think like that?

Ok I'm not really the kind of guy in seeking for others validation.

Cuma what kind of signal yang aku emit sampai diorang boleh anggap macam tu?

Aku cuma duduk kat tempat aku, dan keluar kalau aku ada hal. Bukan aku jenis merayau - rayau borak2 kat tempat lain (kecuali kalau aku balik dari meeting, ada lah aku menyinggah tanya khabar).

So aku anggap, diorang ni actually tak dapat sample yang betul.

I mean, aku jumpa diorang pon waktu - waktu tertentu je..

So obviously diorang tak dapat sample yang banyak, which makes it as a biased estimator.

Right?

Rightt??

...

Jumaat lepas.

Pagi jumaat tu, aku diarahkan oleh bos aku untuk support dia time dia ada meeting dengan board of directors. Basically nanti, bos aku akan explain (berdiri) sambil tunjuk kat skrin projector, dan aku exist kat situ untuk tekan - tekan kompiter. You know, support bos aku.

Tapi,

Disebabkan paygrade aku rendah, so aku tak boleh la nak duduk kat dalam bilik meeting tu for the whole meeting. Aku kene la stay kat luar from 10:00 AM (ah sudahnya turn aku masuk pukul 12:00 tengah hari).

So while waiting outside bilik meeting tu, aku kadang - kadang aku keluar masuk sebab tak nak badan keras. Kena kasi gerak - gerak sikit.

Tetiba tu, ada la sorang kawan aku lalu situ tanya, "Weh ko buat apa depan bilik meeting board of directors tu? Ko join sekali ke meeting tu?".

But me, my nature not telling what my work is, aku berseloroh cakap kat dia, "Aku tukang jaga pintu. BOD lalu, aku bukakkan pintu".

And we both laugh (get it? sebab tu macam sikap mengampu).

Tapi aku tak nak citer apa keje aku. Sebab aku rasa kalau aku cakap tu, macam panjang pulak jadinya. Aku malas nak borak to be honest weh.

...

So it hit me.

Actually, kawan2 aku (yang bukan budak department aku), kalau tanya aku buat project mana sekarang, aku simply jawab "Tak de ape sangat"

  1. Nature of my job, kebanyakkan bos aku punya projek, dia tak kasi aku bagitahu kat orang lain, even dalam department kitorang sendiri pon tak tau projek apa kitorang tengah buat.
  2. Aku malas nak borak panjang - panjang pasal kerje aku. Cukuplah aku kene melayan drama dalam projek - projek aku ni.
  3. Aku rasa macam poyo sangat nak cakap aku buat itu, aku buat ini. Really not my style.

So the implication is that,

  1. "Takde apa sangat" might be translated as takde keje.

So that is it! Aku dapat jawapannya.

Bukan sebab sample size tak cukup. Tapi data yang aku kasi tu salah. So tak kesah it is biased or not, but garbage in, garbage out. Aku bagi input yang garbage, menghadap la aku dengan conclusion yang tak betul.

Huwaaa..

...

Maybe la kan, aku kena ease kan sikit kalau aku borak - borak dengan kawan - kawan aku. Mungkin aku sikit - sikit selit apa kerja yang aku buat sekarang.

Aku tanyalah pendapat kat kawan aku. Kawan aku simple je jawapan dia. Kita ni tak perlu nak cerita kat orang apa kerja yang kita lakukan. Cukuplah bos tau apa kerja yang kita buat.

Betul.

Tak perlu nak citer pum pang pum pang kat orang apa yang kita buat. Tiada manfaatnya.

And believe it or not, masa khutbah jumaat minggu lepas ada topik somewhat related to this.

Kalimah tayyibah membawa maksud apa sahaja perkataan, pertuturan, ucapan dan perbualan yang baik, berhemah, sopan atau apa sahaja yang mendatangkan manfaat, kebaikan duniawi dan ukhrawi beserta kemaslahatan kepada penuturnya, juga manusia lain yang berinteraksi dengannya.

Benarlah ungkapan Pepatah Melayu yang mengingatkan kita, “Kerana pulut, santan binasa, kerana mulut, badan binasa”. Binasalah badan yang mulutnya berbicara tanpa kawalan dan pedoman. Sewajarnya, setiap Muslim berhati-hati dan berwaspada terhadap bicara lisan dan tulisannya.

Renungi hadis riwayat Imam al-Bukhari daripada Abu Hurairah radiallahuanhu, bahawa Rasulullah SAW bersabda, maksudnya: “Sesungguhnya seseorang yang berbicara sesuatu perkataan yang diredai Allah SWT meskipun tanpa disedarinya, lalu Allah SWT mengangkat darjatnya lantaran perkataannya itu. Begitu juga, seseorang yang berbicara sesuatu perkataan yang dimurkai Allah SWT tanpa memikirkannya, maka dengan perkataan itu dia dihumban ke neraka Jahannam.” [105]

...

I'm not saying that I am good. I just wanted to be a better person. 

I'm aiming to start by stop saying unnecessary thing, and hopefully it will lead to my estimated value (as a person), to be a good value.

Something that my kids can be proud of. 

InsyaAllah. Bukan sahaja untuk aku. Tapi untuk kita semua..

...

Source:

[104]: Brader ni just nice je buat gambar unbiased vs biased. Sumber gambar tu kat researchgate ni, https://www.researchgate.net/publication/228553055_Statistical_techniques_for_sampling_and_monitoring_natural_resources

[105] Teks khutbah Jumaat 18 Oktober, 2024: https://drive.google.com/file/d/1Kx7zN3LlYNZ3hRFJMq_xzCzfiKkabi8G/view atau list arkib: https://www.jawi.gov.my/index.php/component/content/article?id=4533&Itemid=472