Halaman

Selasa, 22 Oktober 2024

Penganggar Saksama

0 comments

Bismillahirrahmanirrahiim. Dengan nama Allah yang Maha Pemurah lagi Maha Penyayang.

...

Dulu masa belajar Statistik 1 (basic, the most basic statistic.. 101), ada la satu topik ni. Penganggar. Atau omputihnya, Estimation Value.

Figure 113: Screenshot dari Buku Kerja Satistik (Modul Pengajaran), terbitan UTM, 2001.


So kononnya aku baca balik buku ni sebab (kononnya) nak polishkan balik foundation aku. But, I mean, yeah. The first paragraph tu nampak innocent sangat. Perenggan kedua dah mula kabur - kabur (what's with firasat on math). Perenggan ketiga, satu nombor tunggal katanya. Tapi dalam example - example lepas tu, semua anggaran titik tu adalah variable. Apakahhh

Terus terang aku cakap, sampai la ni aku kadang - kadang masih lagi confuse pasal Estimation Value ni.

But unbeknownst upon me, I'm actually using it a lot. I mean a lot - lot alot.

So let me try to break it down. The estimation value (titik penganggar) digunakan kalau kita tak boleh nak dapatkan anggaran populasi dari sedikit sampel yang kita ada.

In statistik, this is actually quite crucial. So contohnya aku nak ukur average petrol used untuk kereta kat Malaysia ni (usually measured in either Litre per 100 km or kilometer per Litre, in this example, kita guna L/100km).

I can say that, it is impossible untuk ambil data semua manusia di Malaysia ini dan dapatkan nilai L/100km kat kereta diorang.

So what statistician do, is to get the best estimator value, based on apa sample set yang ada. Ok remember that ayat, we will revise it later.

Sekarang ni, kalau aku pergi kat website data.gov.my (particularly at here), kita boleh nampak statistik pengeluaran kereta macam ni (top 10).

Figure 114: Pengeluar dan model kereta paling hangat pada 2024 (data sehingga 30 september 2024).. Gituu

So from here, aku boleh gunakan Top 10 ni untuk dapatkan average L/100KM dengan let say, 72 Perodua Bezza, 64 Perodua Axia, dan sebagainya.

Why Top 10? Hahah sebab data tu je yang aku jumpa. Malas nak carik lagi. But for the actual statistician, they can use any dimension reduction technique. So instead nak gunakan I think about more than 500 jenis/model kereta, they can just pick the one that is statistically significant.

Ok back to our story.

So basically dia ada cara kira dia nak dapatkan berapa enough sample size yang diperlukan.

From there, kita boleh dapatkan ESTIMATED value untuk penggunaan petrol untuk kereta di Malaysia.

Ok? Obviously the math is straight forward.

Let say \( E \left [ X \right ] \) is the estimated value, and \( X \) is the penggunaan petrol dalam unit L/100KM. So...

$$ E\left [ X \right ] = \frac{1}{n} \sum_{i=1}^{n} X_i $$

Easy actually.. kan?

And the standard deviation dia pula,

$$ s=\sqrt{ \frac{1}{n-1} \sum_{i=1}^{n} \left ( X_i - E \left [ X \right ] \right ) }  $$

But actually ni yang sebenarnya aku tak beberapa paham dulu. So the \( E \left [ X \right ] \) is actually the same calculation for average for population, or we call it as mean value, the \( \mu \).

Dan kalau untuk estimation, kita fancy kan \( \mu \) tu pakai topi, jadi \( \hat{\mu} \) (ingat tak, sebelum ni aku ada pernah citer pasal estimation value ni?) (also i kid you not, memang sebut \( \hat{\mu} \) ni sebagai miu hat.. haha)

But the equation is the same.

Yang beza kat standard deviation tu. Itu pon sebab,

  1. Simbol standard deviation untuk population ialah \( \sigma \) manakala untuk sample ialah \( s \).
  2. Dan untuk \( \left ( n - 1 \right ) \) pula adalah untuk correction jadikan dia unbiased. Panjang citer ni. Aku tak rasa aku akan cover ni sebab aku tak terer sangat macam mana proof dia.

Ok point no 2 tu, kita nak jadikan dia supaya unbiased sebab kita nak ianya berdekatan dengan nilai sebenar dia (remember we are still talking about estimator?).

 

Figure 115: Unbiased vs biased, imprecise vs precise [104]
 

 

So what actually make it different?

Data. Data aku collect dari sample, just a part of populasi.

Tujuan. Aku nak dapatkan anggaran without knowing the real value (of population).

But actually the most important part yang selalu kita terlupa (even in this post)... Is the total sample is enough to be estimator for the true population?

A.k.a, sampel kita tu cukup ke??

...

Ok some things happens for me in these several weeks.

Not one, not two, tapi quite numbers of people cakap kat aku, "Fairuz, you ni takde banyak kerja kan?"

I'm stunned.

Aku ni, nampak free sangat ke sampai orang ingat aku ni takde banyak kerja?

Ok I'm not saying that aku ni free je. But to be honest, kerja aku ni memang sampai tak cukup tangan. Sampai aku banyak pass kerje - kerje aku ke team member aku.

But I'm not the kind yang citer kat orang pasal aku buat itu, aku buat ini. Yang paragraph aku citer kat atas tu pon, cuma reader aku je yang baca (aku tak rasa budak office aku baca blog aku ni.. in fact, aku tak rasa ada orang pon baca blog aku ni lol).

Kadang - kadang aku terfikir juga, why did they think like that?

Ok I'm not really the kind of guy in seeking for others validation.

Cuma what kind of signal yang aku emit sampai diorang boleh anggap macam tu?

Aku cuma duduk kat tempat aku, dan keluar kalau aku ada hal. Bukan aku jenis merayau - rayau borak2 kat tempat lain (kecuali kalau aku balik dari meeting, ada lah aku menyinggah tanya khabar).

So aku anggap, diorang ni actually tak dapat sample yang betul.

I mean, aku jumpa diorang pon waktu - waktu tertentu je..

So obviously diorang tak dapat sample yang banyak, which makes it as a biased estimator.

Right?

Rightt??

...

Jumaat lepas.

Pagi jumaat tu, aku diarahkan oleh bos aku untuk support dia time dia ada meeting dengan board of directors. Basically nanti, bos aku akan explain (berdiri) sambil tunjuk kat skrin projector, dan aku exist kat situ untuk tekan - tekan kompiter. You know, support bos aku.

Tapi,

Disebabkan paygrade aku rendah, so aku tak boleh la nak duduk kat dalam bilik meeting tu for the whole meeting. Aku kene la stay kat luar from 10:00 AM (ah sudahnya turn aku masuk pukul 12:00 tengah hari).

So while waiting outside bilik meeting tu, aku kadang - kadang aku keluar masuk sebab tak nak badan keras. Kena kasi gerak - gerak sikit.

Tetiba tu, ada la sorang kawan aku lalu situ tanya, "Weh ko buat apa depan bilik meeting board of directors tu? Ko join sekali ke meeting tu?".

But me, my nature not telling what my work is, aku berseloroh cakap kat dia, "Aku tukang jaga pintu. BOD lalu, aku bukakkan pintu".

And we both laugh (get it? sebab tu macam sikap mengampu).

Tapi aku tak nak citer apa keje aku. Sebab aku rasa kalau aku cakap tu, macam panjang pulak jadinya. Aku malas nak borak to be honest weh.

...

So it hit me.

Actually, kawan2 aku (yang bukan budak department aku), kalau tanya aku buat project mana sekarang, aku simply jawab "Tak de ape sangat"

  1. Nature of my job, kebanyakkan bos aku punya projek, dia tak kasi aku bagitahu kat orang lain, even dalam department kitorang sendiri pon tak tau projek apa kitorang tengah buat.
  2. Aku malas nak borak panjang - panjang pasal kerje aku. Cukuplah aku kene melayan drama dalam projek - projek aku ni.
  3. Aku rasa macam poyo sangat nak cakap aku buat itu, aku buat ini. Really not my style.

So the implication is that,

  1. "Takde apa sangat" might be translated as takde keje.

So that is it! Aku dapat jawapannya.

Bukan sebab sample size tak cukup. Tapi data yang aku kasi tu salah. So tak kesah it is biased or not, but garbage in, garbage out. Aku bagi input yang garbage, menghadap la aku dengan conclusion yang tak betul.

Huwaaa..

...

Maybe la kan, aku kena ease kan sikit kalau aku borak - borak dengan kawan - kawan aku. Mungkin aku sikit - sikit selit apa kerja yang aku buat sekarang.

Aku tanyalah pendapat kat kawan aku. Kawan aku simple je jawapan dia. Kita ni tak perlu nak cerita kat orang apa kerja yang kita lakukan. Cukuplah bos tau apa kerja yang kita buat.

Betul.

Tak perlu nak citer pum pang pum pang kat orang apa yang kita buat. Tiada manfaatnya.

And believe it or not, masa khutbah jumaat minggu lepas ada topik somewhat related to this.

Kalimah tayyibah membawa maksud apa sahaja perkataan, pertuturan, ucapan dan perbualan yang baik, berhemah, sopan atau apa sahaja yang mendatangkan manfaat, kebaikan duniawi dan ukhrawi beserta kemaslahatan kepada penuturnya, juga manusia lain yang berinteraksi dengannya.

Benarlah ungkapan Pepatah Melayu yang mengingatkan kita, “Kerana pulut, santan binasa, kerana mulut, badan binasa”. Binasalah badan yang mulutnya berbicara tanpa kawalan dan pedoman. Sewajarnya, setiap Muslim berhati-hati dan berwaspada terhadap bicara lisan dan tulisannya.

Renungi hadis riwayat Imam al-Bukhari daripada Abu Hurairah radiallahuanhu, bahawa Rasulullah SAW bersabda, maksudnya: “Sesungguhnya seseorang yang berbicara sesuatu perkataan yang diredai Allah SWT meskipun tanpa disedarinya, lalu Allah SWT mengangkat darjatnya lantaran perkataannya itu. Begitu juga, seseorang yang berbicara sesuatu perkataan yang dimurkai Allah SWT tanpa memikirkannya, maka dengan perkataan itu dia dihumban ke neraka Jahannam.” [105]

...

I'm not saying that I am good. I just wanted to be a better person. 

I'm aiming to start by stop saying unnecessary thing, and hopefully it will lead to my estimated value (as a person), to be a good value.

Something that my kids can be proud of. 

InsyaAllah. Bukan sahaja untuk aku. Tapi untuk kita semua..

...

Source:

[104]: Brader ni just nice je buat gambar unbiased vs biased. Sumber gambar tu kat researchgate ni, https://www.researchgate.net/publication/228553055_Statistical_techniques_for_sampling_and_monitoring_natural_resources

[105] Teks khutbah Jumaat 18 Oktober, 2024: https://drive.google.com/file/d/1Kx7zN3LlYNZ3hRFJMq_xzCzfiKkabi8G/view atau list arkib: https://www.jawi.gov.my/index.php/component/content/article?id=4533&Itemid=472

Selasa, 27 Ogos 2024

Re: Setia (alt, Setia Part 2)

0 comments

Bismillahirrahmanirrahiim. Dengan nama Allah yang Maha Pemurah lagi Maha Penyayang.

...

Ok. This is my response to my (own) previous blog post (Setia).

Lets do this!

...

> To be honest, aku ni bukanlah jenis ambil kisah dengan apa yang orang kata pasal aku.

But I'm actually making a blog post mengenai apa yang orang kata pasal aku. In a way, quite hiprokasi juga lah. Haha.

>  Aku tak tau kenapa terdesaknya sampai aku carik sekali kat buku Meta-Analysis tu

Aku memang saja suka selak - selak buku itu ini tengok - tengok apa yang menarik.

>  Figure 106.

Ok. I have a decent computer. So patutnya aku boleh lukis gambar yang lebih cantik.

Like this.

Figure 108: Is actually Figure 106, cuma lebih cantik. Setiap orang suka pada kecantikkan bukan?

Ok this figure is actually generated using python dengan bantuan ChatGPT (remember, my new best friend haha). So it does look kinda nice.

> Now, whenever kita accelerate, akan ada traction sikit. We call it as a gradient.

Yang ni yang aku nak eksplain lebih sikit. Sebab lepas aku baca balik blog post aku tu, aku rasa aku banyak skip the important part. 

Gradient is the titik perubahan atau slope sesuatu function kat mana - mana point kat line tu.

Now what i have skipped, is that the tangent. The line yang aku tulis tu is actually the tangent. So tangent line, is a line, yang kalau kat titik gradient tu, akan ada satu line yang perpindicular (90 degree) dari titik tersebut.

Bak kata lecturer aku dalam 20 tahun lepas, dia kata kalau kita draw betul - betul, dia cantik je bersentuhan line tu dengan function \( f(x) \) tu.

 Ok kita tengok contoh sikit.


Figure 109: Graf untuk \( f(x) = x^5 - 5^3 +4x \) dan \( f'(x) \)

\( f'(x) \) atau \( df(x)/dx \) tidak menunjukkan gradient sangat kalau kita tengok tu, tapi kalau kita tengok kat graph kat bawah ni,

Figure 110: Gradient dan tangent - contoh.

So kita boleh tengok gradient di titik \( x= -0.5\), \( x=0.5\) dan \( x=1.75 \). Macam kat \( x= -0.5\) kita nampak gradient dia menaik sedikit, sama macam kat \( x= 0.5\). Tapi kat \(x = 1.75 \) dia menaik banyak.

How how can we actually measure the perubahan. It is easy actually. Kita draw satu line yang perpendicular dan sentuh nicely kat \( f(x) \) tu.

Atau, kalau kita nak tengok perubahan dia, boleh try tengok kat gif ni.

Figure 111: Animasi gradient kat setiap titik (titik merah tu) dan tangent line dia (line oren tu).

Ok sekarang kita faham kan?

> \( \text{faithful, atau, }f \text{ is when } \frac{d }{dt}=c \label{faithful_1}\tag{3} \)

Walaupon menggunakan \(  \frac{d }{dt} \) tu bukan satu kesalahan besar, but usually we need to add something to the 'upper' \( d \) so that we know what is we are differianting against.

So the more better way is,

\[ \frac{dy }{dt}=c + \epsilon \]

where \( y \) we define as our feelings/closeness to something/somebody.

> For second one, in our case, the \( \epsilon \) has become uncontrolled, and has change the meaning of the equation itself.

Sebelum tu kita dah define, kalau kita dah masuk stage setia, the differential untuk diri kita is actually constant.

Kalau kat Figure 108 tu, yang second part (lepas dari \(x = 7.5\)) tu kita mark dia sebagai setia sebab there's no gradient in there.. In a way, setia.

But when we said that the \( \epislon \) has become uncontrolled, what i mean is like this.

Figure 112: When \( \epsilon \) has become too large, it change the trejectory and make me, tak setia dah.

Naturally, in mathematics, \( \epsilon \) is considered as a small value that is quite crucial untuk pastikan sesuatu hasil atau equation yang kita bina tu is OK.

So what I'm trying to say is that, when \( \epsilon \) has change its own meaning, thus changing the whole point of being setia.

...

Right.

So basically this is my problem. Aku cuba nak ketengahkan idea aku. Kadang - kadang masa aku cakap tu, aku banyak skip a lot of important part sebab nak make this entry as an easy reading.

Tapi oversimplify tu yang banyak memakan diri. Lots of details yang hilang. Lots of story is changed.

Tapi kalau aku letak detail sangat, aku rasa macam buat entry aku makin complicated pulak.

> Ok saja nak share macam mana thought process aku untuk benda - benda macam ni... That is why aku tak banyak kawan!

True. Aku susah sikit nak bercakap dan duduk di antara oversimplify and overcomplicated concept. Either im going to extreme explaining or just simply skip all the details.

What I actually want is, bersahaja (moderate) in everything.

Yes I'm still doing that. I'm still setia with the concept.

Because I know, that will surely help me to be a better person.