n > 30 ??
Berikut penjelasan singkat dari saya, mudah-mudahan berguna.
Kita berangkat dari yang namanya peubah acak. jika X adalah peubah acak, maka fungsi dari X juga merupakan peubah acak. rata-rata (kita di IPB biasa pakai rataan, x-bar) merupakan fungsi dari data X1, X2, …, Xn yang kita asumsikan merupakan peubah acak dengan sebaran tertentu (tidak harus normal). karenanya x-bar juga merupakan peubah acak, yang tentu saja punya sebaran (distribusi). lalu apa distribusinya?
jika Xi(data kita) merupakan peubah acak yang iid (independent-identical distribution) karena kita anggap data merupakan random sample yang memiliki sebaran NORMAL, maka x-bar akan memiliki sebaran NORMAL, BERAPAPUN SAMPLE SIZE-NYA. kurang dari 30 atau lebih dari 30, kalau X (data) berasal dari sebaran NORMAL maka rataan (x-bar) juga memiliki sebaran NORMAL. hanya beda parameternya. Kalau datanya menyebar normal dengan nilai harapan MU dan ragam SIGMA-KUADRAT, maka x-bar memiliki nilai harapan MU dan ragam SIGMA-KUADRAT-DIBAGI-n.
Dengan demikian, x-bar dikurangi MU dibagi akar dari SIGMA-KUADRAT-DIBAGI-n, akan memiliki sebaran NORMAL BAKU (nilai harapan 0, ragam 1). Tapi jika nilai SIGMA-KUADRAT is unknown, dan diduga dengan ragam contoh, maka sebaran x-bar dikurangi MU dibagi akar dari STDEV-CONTOH-DIBAGI-n adalah t-student berderajat bebas (n-1).
Lalu bagaimana dengan sebaran x-bar jika datanya (Xi) tidak berasal dari sebaran normal? Jelas bahwa x-bar tidak menyebar normal. namun central limit theorem says bahwa untuk n menuju tak hingga (infinity) x-bar dari data dengan sebaran apapun memiliki sebaran yang konvergen ke sebaran normal. Prakteknya bagaimana? Mana mungkin kita punya data yang banyaknya tak hingga. Empirical study by simulation menunjukkan bahwa ukuran 30 secara umum sudah menghasilkan kekonvergenan yang disebutkan diatas. Angka 30 tidak bisa digunakan sebagai patokan yang tidak bisa digoyang-goyang. Angka 30 umumnya cocok kalau sebaran X asal meskipun tidak normal tapi bentuknya simetrik. Kalau tidak simetrik, n yang diperlukan lebih besar agar distribusinya konvergen ke normal.
Detailnya bisa dilihat di Hogg & Craig atau Casella & Berger. mudah-mudahan bermanfaat.
Salam,
bagusco
http://bagusco.blogspot.com
http://www.geocities.com/bagusco4/bagusco.html
Tags: Normal, Sebaran, Statistika
You can comment below, or link to this permanent URL from your own site.
8 Desember 2006 at 3:19 am
kalau data ordinal (diskret) ingin dinormalkan caranya bagaimana?bisakah dengan z-score ?.terimakasih
8 Desember 2006 at 3:46 am
z score itu transformasi data dg rataan dan standard deviasi.
z=(x-xbar)/stdev
sebaran normal adalah sebaran untuk data kontinu. orang suka bikin gampang aja dg mengatakan skala data nominal dan ordinal masuk data kategorik sedangkan skala data interval dan rasio masuk data nominal. Ini kurang tepat! tidak ada hubungan antara skala data NOIR (Nominal Ordinal Interval Rasio) dan KK (Kategorik Kontinu). aku lupa contohnya, ada di bukunya pak andi hakim nasoetion, alm. nominal dan ordinal pasti kategorik (diskret) tapi interval dan rasio belum tentu kontinu.
untuk kasus data ordinal ingin dibikin sebaran normalnya tentu saja tidak bisa, karena data ordinal termasuk data kategorik (diskret) yg mempunyai kelompok sebaran sendiri. sedangkan sebaran normal adalah kelompok sebaran kontinu.
kalo ditransformasi z-score apakah jadi normal. menurutku ga juga. coz walopun udah z-score, tetep aja datanya tidak jadi kontinu (terpotong-potong).
ya udah terima saja takdir data itu menjadi ordinal. tapi tunggu, gw tanya temenku dulu. stay tune aja!
8 Desember 2006 at 9:07 am
hehehe, jd inget ts nya pak anang….
kl dg central limit theorem, jika x variable nya random dari distribusi peluang dengan finite mean and finite variance, maka sebaran x bar akan menyebar normal.
rule of thumbnya ada yg bilang n=30
hmm gak disyaratkan x harus continues.
masih inget kan kayak contoh kita menghitung peluang pas metdas tk 1 [jaman kita masih muda:)]
misalnya setuju atau tidak setuju thd poligami [HAHAHA again????]
peluang ini kan discrete var.
tp dg jumlah samples yg besar, bisa tes confidence interval (dg t atau z dist) atau t atau z test nya.
kl di textbook year 1 nya sini seh (last year i gave tutorial for this subject], utk kasus peluang rule of thumbnya n.p>10 dan n(1-p)>10
jd intinya, menurut saya bisa.
z score itu adalah menstandardisasi [bhs indonesia yg benarkah ini??] or standardize x yang menyebar NORMAL.
jd si x harus menyebar normal dulu [yg bisa diasumsikan dg central limit theorem di atas]
semoga membantu
wassalam
8 Desember 2006 at 10:20 am
Brarti solusinya gini bukan, si data ordinal itu dibikin kelompok2, terus dicari Xbarnya.
Xbar Xbar ini akan menyebar Normal dengan nilai harapan MU dan ragam SIGMA-KUADRAT-DIBAGI-n (kata mas bagus gitu, tapi n nya n yg mana yak, n-nya Xi apa n-nya Xbar? Kayaknya sih n-nya Xbar).
z = sqrt(n)*(x bar- mu)/sigma ~ N(0,1)
atau z=(x bar- mu)/ sigma per akar n ~ N(0,1)
kan penduga standar deviasi (akar variance): sigma per akar n
21 Februari 2007 at 6:22 am
pengen nanya dunk.
gimana caranya data ordinal diubah jadi data interval? katanya c pake msi?tapi ga ngerti, kalo di spss ada ga msi? atau ada prog komp lain yg bisa msi? ni aja dulu d. tar kalo dijawab baru ada pertanyaan lanjutannya. =) makasih yah
21 Februari 2007 at 11:15 am
msi apa yah?
FYI aja. Kalo data ordinal tingkat preferensi: sangat suka, suka, biasa saja, tidak suka, sangat tidak suka, atau yg sejenisnya, ada (ahli psikologi) yg mengatakan bisa jadi interval. Istilahnya skala likert. Kalo ga salah gitu deh?
11 Maret 2007 at 12:50 pm
Matching regression tu apaan yach?
g bisa ngerjain tugas ni…
thanks
13 Maret 2007 at 3:53 am
Baru denger tuh ada “matching regression”.
Bisa lebih jelas? Mungkin ada beda penamaan aja.
22 Maret 2007 at 1:28 pm
tolong dong …
tentang transformasi box-cox
ama grafik pengendali individual-moving range
thank’s ya..
7 Agustus 2007 at 5:02 am
mba tolong dunk…
kenapa sich jika kita ingin mengambil data sub group rata-rata ko 4 kelompok atau 5 kelompok ex (x1,x2,x3,x4,x5) dari 28 hari., katanya disemua industri seperti itu….tp saya bc d i buku kualitas biasanya data diambil dari (4 s/d 10 sub group)
dan berikan alasannya
ditunggu …cepet yaaaa
15 Agustus 2007 at 2:54 am
Maaf mba dea, saya belum menangkap masalahnya.
9 September 2007 at 1:03 am
mba tlng dong, aq masih bingung kenapa untuk mencari ragam contoh harus dibagi dgn n-1(knp ga samaaja dgn ragam populasi).
10 September 2007 at 6:06 am
Eh sebelumnya saya luruskan dulu, bahwasanya saya adalah seorang laki-laki tulen. Cukup panggil Mas, Aa, atau Akang terserah.
Mba Tiwi, perhitungan ragam itu adalah dibagi dengan n-1, perhitungan ini suka dipakai dalam ragam contoh. Nah untuk ragam populasi, mengingat data populasi itu banyak maka pembagian dengan n-1 atau n saja tidak akan banyak berbeda. Untuk keperluan praktis, dipakai n saja untuk ragam populasi. Sepengetahuan saya selama kuliah sih seperti itu. Kalau secara teori (rumus) saya belum tahu…
21 Nopember 2007 at 9:20 pm
maap.. mas…
saya bener2 newbie, amatir, de-el-el, ttg statistika dan keluarganya…
saya ada masalah niy dalam uji asumsi klasik normalitas untuk penggunaan regresi….
begini, saya mo tanya… emang ada ya teori yg menyebutkan kalo kita punya sampel yang > 30, maka data dapat di asumsikan memiliki distribusi normal, meskipun sebenarnya jika di uji menggunakan SPSS menghasilkan asymp. sig. < 0.05 (yang artinya tidak normal)… ?
trima kasih atas perhatiannya…
-alvin-
22 Nopember 2007 at 2:15 pm
Seperti yg disampaikan di tulisan di atas. Tidak ada teori yg menyampaikan bahwa kalo sample >30 maka menyebar normal. Perlu diingat pula bahwa sampel (data) dalam hal ini adalah x-bar (rataan) bukan data mentah.
Di paragraf ke-2 terakhir disebutkan:
“Empirical study by simulation menunjukkan bahwa ukuran 30 secara umum sudah menghasilkan kekonvergenan yang disebutkan diatas. Angka 30 tidak bisa digunakan sebagai patokan yang tidak bisa digoyang-goyang. Angka 30 umumnya cocok kalau sebaran X asal meskipun tidak normal tapi bentuknya simetrik. Kalau tidak simetrik, n yang diperlukan lebih besar agar distribusinya konvergen ke normal.”
22 Nopember 2007 at 7:48 pm
jadi.. solusinya gmana kira2 mas… ? bisa bantu ?
saya punya data dengan tipe rasio, jumlah sampel totalnya 388, saya akan membuat model regresi multipel Y = a + bX1 + …. + bX5
kan, sblmnya harus uji klasik normalitas, multikolinearitas, heterokedastisitas, dan autokorelasi.
Semua uji lolos kecuali uji normalitas. Kira2 apa yg harus saya lakukan untuk bisa lolos dari uji normalitas ini. ?
maap kalo saya ngebahas topik yg beda dari isi blog.
Terima Kasih
-alvin-
23 Nopember 2007 at 8:38 am
…no problemo…
Dalam membuat regresi OLS (kuadrat terkecil biasa), ada 4 asumsi: model harus additif, error-nya menyebar normal, error-nya mempunyai variance yg sama, error-nya acak (tidak berpola). Diantara 4 ini, yg paling penting adalah error-nya mempunyai variance yg sama. Karena di OLS menggunakan uji variance (Uji F atau tabel ANNOVA=tabel analisis variance).
Selain itu, regresi OLS juga harus bebas dari 3 masalah berikut:heteroscedasticity, multicollinearity dan autocorrelation.
Kalo asumsi tidak terpenuhi atau terjadi masalah2, maka yg pertama harus dilakukan adalah mengechek kembali data Anda, bisa jadi ada salah ngentri atau salah pengambilan data. Kalo bukan karena itu, yg kedua, lakukan transformasi. Kalo masih terjadi, maka hapus data (record) tsb.
Nah dalam hal transformasi, di sinilah seninya: bagaimana mendapatkan transformasi yg optimal sehingga asumsi terpenuhi atau masalah teratasi. Kalo pake minitab ada Box Cox transformation untuk mencari transformasi optimum. Bisa coba2 sih misalnya transformasi pangkat 2, akar, log, lon, seper (pangkat -1), dsb. Yg ditransformasi bisa variabel y-nya atau x-nya.
Nah untuk masalah normalitas error, kalo ngga terpenuhi setelah mengeluarkan segala jurus, maka ngga apa2 lah ngga terpenuhi juga, yg penting mah variance error harus sama.
Begitu… Mudah2an membantu…
23 Nopember 2007 at 8:47 am
pagi mas,
saya juga punya masalah yang sama ama alvin.
jumlah sampel sy ada 34 dengan 5 tahun penelitian, sy menggunakan pooling jadi N=170.
dari uji normalitas (kolmogorov) variabel dependen dan 2 var independen sy (dari 4 var) gak berdistribusi normal.
apakah bisa jika sy katakan dengan teori sentral limit, data sy asumsikan berdistribusi normal ????
thx n sy tunggu jwbx…
23 Nopember 2007 at 9:04 am
Teorema limit pusat itu bisa dibuktikan dengan hasil uji normal yang menyebar normal.
In term of normality assumption in OLS, (yg gw tahu) yg harus menyebar normal itu error-nya bukan data di variabel2 independennya. Caranya di-run dulu model regresinya, kan dapat data error tuh. Nah error inilah yg diuji normalitasnya.
23 Nopember 2007 at 11:07 pm
hehe… sangat membantu mas, dr yg diceritain di atas…. tapi… duh mas, punten pisan euy… saya mo nanya lagi gpp ya… ^^v
gini mas…
1. variance error itu simbolnya apa ya mas, maksud saya dihasilkan dari uji apa ? atau kalo mas pake SPSS bisa kasi tau lebih detil ?
lalu, referensi teori bahwa variance error yg sama itu bisa digunakan untuk menggantikan hasil normalitas (yang tidak normal) bisa saya dapat dari buku apa ya ? Gujarati-kah ato yg laen mungkin ?
2. kalo di data saya di variabel y dan x nya terdapat data negatif (karena saya meneliti keuntungan dan kerugian perusahaan) metode transformasi apa yg sebaiknya saya gunakan ?
lalu, referensi teori dasar untuk menentukan transformasi yang tepat, (seperti kenapa hanya var x ato hanya var y yg di transformasi, dan kenapa menggunakan log, lon, akar, pangkat 2) itu ada di buku apa ya ?
mas, bener deh, saya niy minta ampun deh masalah statistik, dan saya membutuhkan referensi itu utk skripsi saya…
jd, saya cuma mengharapkan kebaikan mas ipk4cumlaude utk nge-bantu saya….
Trima Kasih
-Alvin-
24 Nopember 2007 at 10:45 am
Mas, mau tanya nih, saya punya masalah sama seperti lia diatas. Tapi saya masih bingung dengan jawaban yg mas berikan.
Bagaimana mengubah data ordinal ke data interval???
Saya sedang menyelesaikan skripsi saya, namun pusing 7 keliling karena masalah ini. Katanya harus pakai metode successive interval (MSI), tapi bingung gmn caranya.
Saya punya program SPSS 11.5 dan Macro Minitab 13.2, bisa tolong dijelaskan cara2nya secara bertahap, karena saya bingung sekali. T_____T
Makasih banyak ya mas, ditunggu jawabannya.
26 Nopember 2007 at 11:19 am
#Re: 20 alvin
1. Simbol variance error itu sigma e (sigma huruf kecil yg latin itu terus ada e huruf kecil latin juga). Caranya short data error dan data salah satu variabel, by data variabel. Kalau data variabelnya continue, bikin kelompok secara manual, aturannya terserah. Nah kita dapat kan kolom baru “kelompok”. Kalo di minitab, klik menu Stat >Basic Statistics > 2 Variances. Pilih yg Samples in one column, masukkan error di samples dan kelompok di subscripts. Kalo p-value > alpha (di mana misalnya alpha=0.05) maka ragam error homogen.
2. Coba aja semua transformasi yg mungkin. Kan kalo pake lon, log dan pangkat desimal itu ngga mungkin. Jadi sisanya pake pangkat bilangan bulat. Atau bisa juga didiferensiasikan (data t dikurangi data t-1), atau ditransormasi normal baku (z score) atau apalah, bergantung data dan studi kasusnya juga sih (harus make sense juga). Gw juga sering stress kalo udah ngotak-ngatik ngga ketemu transformasi yg sesuai. No Pain No Gain lah… Berjuang terus. Gambatte!
Kalo bukunya sih ngga tau. Di perpustakaan statistika banyak buku kan. Kalo gw dulu pas kuliah pake bukunya lupa…. (gomen). Terus kalo kenapa y atau x yg ditransformasikan, itu menurut gw sih bebas aja. Yang penting kan gini, untuk analisis statistika tertentu, butuh asumsi2. Nah transformasi ini untuk memenuhi asumsi2 itu. Kalo asumsinya ga terpenuhi bisa melenceng hasilnya. Nah gimana caranya (transformasi apa) sehingga bisa memenuhi asumsi itu.
26 Nopember 2007 at 11:47 am
#Re: 21. Harry
Pertanyaannya adalah mengubah (mentransformasi) data ordinal ke interval.
Pertanyaannya bagus, gw jadi pusing juga. Waktu kuliah gw pernah ngambil mata kuliah Metode Simulasi. Isi mata kuliah itu mentransfromasikan sebaran2 data2 misalnya dari data yg discrete uniform menjadi normal (continue) atau jadi Chi squared (continue).
MUNGKIN mata kuliah ini jawabannya. Ini teori banget (teori dalam Statistika isinya bukan hafalan2 kalimat tapi rumus2, cacing2, turunan2, sigma2, dan angka2). Gw udah lupa banget gimana caranya walaupun dulu pernah bikin program macro-nya untuk melakukan transformasi tsb, yang pasti teorinya ada di buku Simulation Method atau ringkasannya ada di lampiran Mathematical Statistic (Teori Statistika).
Maap saat ini gw ga bisa jawab gimana caranya, secara gw udah lupa banget dan program macronya entah kemana. Googling aja lah macronya (macro minitab or SAS) mungkin orang bule udah ada yg bikin, atau hubungi anak Satistika (IPB) tingkat 3 yg udah ngambil mata kuliah metode.
Kalo MSI gw ga tau… Maap ngga membantu…
26 Nopember 2007 at 8:56 pm
makasih ya kang… saya coba beri tindakan dulu….
jgn bosen ya kalo nanti saya nanya2 lagi….
yo weis….
hatur nuhun
-Alvin-
29 Nopember 2007 at 11:59 am
Beberapa orang ada yg nanya MSI (method of successive interval), berikut link pdf nya.
30 Nopember 2007 at 2:32 pm
Duh, iya nih mas, bingung bingung. Ternyata caranya bener2 rumit.Cari di om google juga ga nemu2. Kayanya orang amriknya bingung juga.pdfnya sdh saya buka dan dicopy paste program yg ada di notepadnya, tapi eror pas dimasukin ke macro minitabnya.
Jadi makin pusing aja. >_<
Makasih ya mas, kalau dapet info lengkap caranya, kasih tahu disini ya.
6 Desember 2007 at 12:10 pm
mas kalo menormalkan data yg ujinya compare mean & bukan regresi gmn ya caranya? saya pake spss.
Saya ingin pake parametrik biar bisa langsung kurangkan meannya antar samplenya. (klo nonpara cuma bisa liat signifikansinya kan??..bener ga?)
klo petunjuk mas diatas yg pake log dkk itu berarti utk yg ada x dan y kan ya…
help plz…
makasih
ana
7 Desember 2007 at 11:24 am
Gimana ya… Datanya memang data apa?
18 Desember 2007 at 9:59 am
Proses analisis data antar regresi dengan uji asumsi klasik mana yang di dahulukan, apakah data yang sudah valid dan reliable langsung diregres, atau diuji asumsi klasik terlebih dahulu, terima kasih
18 Desember 2007 at 11:06 am
Mas Agung,
Analisis statistik kan ada banyak, juga regresi ada banyak jenisnya. Setiap analisis itu bisa di-run dengan data yg menuruti persyaratan tertentu yang disebut asumsi. Jadi, agar bisa di-run harus memenuhi asmusi yg disertakan bersama analisis itu. Misal asumsi regresi dengan metode OLS ada 4, yakni: model bersifat additif, ragam galat seragam, galat menyebar normal dan galat acak. Walaupun datanya sudah lolos uji validitas dan realibilitas, tetep aja untuk menggunakan anlisis regresi harus memenuhi asumsinya.
Dalam hal mana yg duluan, ini bukan masalah duluan analisis atau uji asumsi dulu karena ini dilakukan secara simultan. Misal asumsi galat menyebar normal dilakukan dengan melakukan analisis regresi terlebih dahulu untuk mendapatkan data galat-nya. Barulah galat ini diuji kenormalannya. Malah yg masalah itu gimana caranya asumsi terpenuhi biar bisa pake analisis tsb…
12 Januari 2008 at 6:05 pm
ka tolong dong klo angka yang + & yg X TUH HARUS SAMA HASIL NYA MANG APAAN AJA sih please dunk ??????????!!!!!!!!!
12 Januari 2008 at 6:13 pm
hi aku nak baru nich namaku diva masalah ku tuh sama ky mawar tlg dunk kak jawabanya ku tunggu loh!!!!!!!!!!!!!!!!!! thanks
14 Januari 2008 at 10:42 am
Sorry Mba Mawar sama Mba Diva, bisa lebih jelas pertanyaannya. Sorry nih gw agak telmi alias lemot….
17 Januari 2008 at 7:30 pm
mas, ni pertanyaan “o’on” sebenarnya tu beda antara regresi linier berganda sama metode ordinary least square tu apa?
apa keunggulan metode ols? gunanya metode ols apa?mengapa mesti menggunakan metode ols?
apa fungsi logaritma natural?
18 Januari 2008 at 9:16 am
#nia
jawab aja gini:
Jadi O’on nanya ke mba nia
- Regresi yg widely known itu namanya Ordinary Least Square Regression, yakni regresi yg menggunakan pendekatan kuadrat terkecil biasa. Artinya metode ini, mencari error yg telah dikuadratkan (kalo ga dikuadratkan bisa saling menghilangkan) antara Y aktual dan Y dugaan. Kira2 seperti itu gampangnya.
- Kalo regresi berganda itu regresi menggunakan variabel X yg tidak single. X-nya ada banyak, misal: Y=f(X1, X2, X3) atau Y=a+bX1+bX2+cX3. Metodenya bisa pake OLS atau metode lain e.g. Bayes.
- Keunggulan OLS gampang, gunanya sama kaya metode lain untuk melihat pengaruh dan besaran hubungan antar peubah.
- Logaritma natural? mmhhh… siapa yg bikin itu ya… Tapi kalo gw suka pake untuk transformasi biar angkanya jadi kecil2. Atau bisa juga di financial mathematic, untuk melihat return.
21 Januari 2008 at 5:43 am
mau nanya..
kalo skala peringkat/rank
(misal : preferensi merk.urutin dari 1 sampe 5 dari merk yang paling disuka sampe gak disuka)
mmm.kaya gitu likert (nominal) atau ordinal jadinya?
kalo nominal kan brarti bisa pake msi…
(btw msi itu ada di software ExcellStat..semacam software tambahan buat microsoft Excell)
gw search buat nge-intervalin skala rank gitu pake thurstone’s case V.ada di software PC-MDS.cuma ampe sekarang software itu belom nemu2 (susah banget.kalo beli lisensi resmi 4.5 juta)
huhu..
21 Januari 2008 at 10:45 am
# Renita
Bisa masuk likert. BTW likert itu bukan nominal, tapi lebih tinggi lagi: ordinal bahkan bisa jadi interval dengan MSI itu. Sebenernya skala likert itu awalnya adalah continue tapi terus dibikin groupingnya jadi misal cuman ada 5 grup saja (kategorik). Itulah alesannya kenapa likert bisa dibalikin lagi dari kategorik menjadi continue.
12 Februari 2008 at 12:48 pm
si bodo bertanya,
solusi variabel yang tidak terdistribusi secara normal itu bagaimana?
begini,
saia menggunakan empat variabel independen dan salah satu dari empat ini ada yang tidak terdistribusi normal.so?
in confuse,
>________<
12 Februari 2008 at 1:48 pm
Udah saya tulis di atas. Komen no 17 coba baca. Baca semua sih kalo bisa mah!
12 Februari 2008 at 7:35 pm
huah,iayah…saia gak baca (hohoho..).
nah,sgala jurus tu pa aja ya,mas?
variabel saya yang gak terdistribusi normal tu hasil p-p plotsnya aneh.jadi yang harusnya ada disekitar garis,ini enggak.tapi malah ke samping (mendatar).nah, ntu gimana mas?
uhhhmmm…maap kalo saya masi aja kurang ngerti ^^
13 Februari 2008 at 8:22 pm
salam…
bagaimana jika uji autokorelasi menghasilkan DW sebesar 1.254 yang itu berarti tidak dapat disimpulkan?langkah apa yang bisa saya lakukan?
kemudian apakah hal ini akan dapat mengakibatkan beberapa hal seperti jika terjadi autokorelasi?
makasi buanget,nget..klo si mas mu jawab.binguuuuunng..benerbener gak bisa statistik >.<
14 Februari 2008 at 10:44 am
#40. si bodo
Walah nanya segala jurus. Maksudku dalam hal transformasi data ada banyak kemungkinan, nah coba aja semua plus insting dan hoki juga…
Berarti variabelnya tidak menyebar normal, kalau mau uji formalnya silakan pake software Minitab. Tapi sebenernya variabel ga menyebar normal itu ga masalah, soalnya 4 asumsi regresi OLS tidak mengatakan bahwa variabel harus menyebar normal, tapi error lah yang harus menyebar normal. Coba perhatikan baik2 asumsi OLS. Jangan pabeulit bin pagujud gitu atuh. Bukannya udah saya katakan di atas, aduuuhhhhh…!!!!!! Grrr…rrrr Wuff…Wuff… Aauuuuuwww….!!! miaow..!
#41. oppi
Silakan baca di sini http://ipk4cumlaude.wordpress.com/2008/02/14/mendeteksi-autokorelasi/
14 Februari 2008 at 4:35 pm
wah..keren buanget dah….
semua pertanyaan dibabat…tapi kok saya masih bingung yah…
14 Februari 2008 at 5:47 pm
#43 weibullgamma
wuff…!!!
8 Maret 2008 at 12:46 pm
mas saya mau tanya, apa tujuan mengubah data ordinal menjadi interval? kanapa harus diubah sebelum diolah dengan SPSS?
2 April 2008 at 12:01 pm
Mas, nanya ya mas. Saya menggunakan regresi berganda dalam penelitian saya. Program yang saya gunakan adalah SPSS 15. Topiknya tentang kinerja saham, dan hasilnya seperti ini:
Y=2,989+0,042X1-4,1E-7X2-0,0045X3-0,097X4-0.23X5-0,0001X6
Konstanta pada variabel ke2 itu 0,00000041 karena datanya ada yang besar sekali, ada pula yang minus. Pertanyaannya:
1. Transformasi apa yang harus saya lakukan? Saya hendak memakai log natural(sebelumnya sudah pd var X5), tapi kan ada data yang minus pada var X2 sehingga tdk terdefinisi ketika di log-natural. Saya g pgn data yang abnormal dihilangkan.
2. Distribusi normal biasanya kan per variabel, tapi,smua variabel saya gabungkan jd 1,karena kalo per var, ada 2 yang g normal. ini “statistrik” bkn? Boleh g mas?
Mohon bantuannya, udah final nih.Hix….Hix….
Terimakasih…….Terimakasih……
2 April 2008 at 2:18 pm
1. Kalau datanya besar sekali, dibagi aja dengan sejuta atau berapalah sehingga antar peubah memiliki satuan yg sama, misalnya dalam ratusan, puluhan atau ribuan. Ini juga namanya transformasi, tak usah susah2 pake log-logan. Tapi jangan lupa nanti pas interpretasi dibalikin lagi satuannya atau disebutin bahwa ini adalah dalam satuan jutaan or whatever lah.
2. Sebaiknya Anda baca2 lagi deh. Yang harus menyebar normal itu apa? Di tulisan komentar atas (#42) sudah saya sebutkan, bahwa dalam asumsi regresi OLS, ERROR lah yg harus menyebar normal.
Mudah2an membantu….
3 April 2008 at 9:08 pm
1 & 2.Oiya.yah….
Langsung dikerjakan mas.
Terimakasih….Terimakasih……
9 April 2008 at 9:50 am
uji normalitas dengan menggunakan SAS kayak mana yah? terus uji asumsi penduga tetap BLUE itu yang mana duluan (urutannya)? normalitas dulu, heteroskedastisitas dulu, multikolinieritas dulu atau autokolerasi dulu?
9 April 2008 at 1:25 pm
Wah entahlah udah lama ga pake SAS. Yg BLUE juga urutannya saya ga tau. Setahuku semuanya sih harus terpenuhi. Adakah yg mau membantu?
(dari dulu ga ada yg bantu jawab pertanyaan2 tentang modelling, whuih cape juga, ditunggu ya…. terutama yg masih fresh: anak2 angkatan 41,42, atau 43, bantu dong!)
9 April 2008 at 4:05 pm
waduh Mas….takutnya salah ngasih jawabannya….karena….masih banyak temen2 yang lebih pinter dari saya…
normalitas itu yang paling terakhir…soalnya dampaknya pada selang kepercayaan..(karena selang kepercayaan parameter2 dibuat berdasarkan sebaran normal)…sedangkan pendugaan parameternya tetap bisa dilakukan selama asumsi2 yang lain terpenuhi….
Yang paling penting itu, klo heteroskedastisitas dampaknya pada pendugaan parameter dengan OLS…pada kasus homoskedastisitas, setiap peubah mendapat bobot yang sama dalam perhitungan parameter …klo heteroskedastisitas trus dipaksakan pake OLS, hasilnya parameter mungkin berbias…
Autokorelasi juga berdampak pada pendugaan parameter. biasanya pada data time series atau cross-section….galatnya berpola sehingga menyebabkan bias pada pendugaan parameternya…
multikolinearitas itu lebih terakhir lagi, soalnya klo udah dapat model terbaiknya dan ketiga asumsi diatas udah terpenuhi, mungkin dapat diatasi dengan Regresi Komponen Utama atau Regresi Gulud…
klo urutan….he he he..saya juga masih bingung….
mohon maaf klo ada yang salah..maklumlah…masih pemula….
anda bingung?..saya juga….
13 April 2008 at 7:58 pm
klo pake sas itu yang proc reg….aduh..saya juga bingung…
15 April 2008 at 2:57 pm
Makasih ya wei, udah jawabin.
Kemaren juga udah baca2, kalo datanya series maka coba pay more attention in autokorelasi, kalao datanya cross-section, multikol-lah yg harus mendapatkan perhatian lebih…
16 April 2008 at 5:57 pm
Senang nih Baca blognya mas ipkcumlaude banyak dpt pencerahan.
Saya mo nanya nih mas,
lg skripsi nih da pusing bgt….
kalo uji dilakukan dengan analisis diskriminan apakah seluruh uji asumsi klasik hrs dipenuhi ?
kl ga asumsi apa aja yg hrs dipenuhi?
mohon pencerahannya mas……….
makasih.
17 April 2008 at 3:02 pm
Setiap analisis statistik memiliki asumsinya masing2. Termasuk analisis diskriminan. Ada baiknya beli buku mengenai Analisis Multivariate (ada buku SPSS Multivariate). Analisis diskriminan ini berbeda dengan uji asumsi regresi biasa, karena analisis diskriminan termasuk analisis multivariate, di mana datanya tidak menyebar normal tapi normal ganda. Ada 3 asumsi: uji normal ganda, uji beda vektor nilai tengah dan uji kehomogenan ragam. Teknisnya mening beli buku tadi. Sorry ya… ga bisa bantu banyak.
23 April 2008 at 10:51 am
1. klo asumsi homoskeadtisitas dan normalitas ga terpenuhi gmn transformasinya?soalnya pemilihan model transformasi juga kan harus hati2. ada yang bilang bisa diabaikan pelangaran asumsi tersebut pada kondisi dan alasan tertentu, nah itu gmn?alasannya apa kalo asumsi tsb boleh dilanggar dan ga perlu transform?
2.Kalo masukin input u/ uji homogeneity of variance (Levene), misalkan saya punya 5 var independen, 1 var dependen, yg dimasukin jadi faktor yg mana, yg jadi dependent list yg mana?soalnya di kolom inputnya, faktor hanya cukup untuk masukin 1 entry sedangkan dependen list justru bisa masukin banyak
Nuhun pisan atas jawabannya ntar..
23 April 2008 at 2:58 pm
kenormalan yang biasanya gpp dilanggar asal yang laen terpenuhi…karena kenormalan untuk pendugaan selang kepercayaan parameter(seperti yang telah dijelaskan sebelumnya).klo transformasi…kata ibu Ita, silahkan baca di buku pak Aunudin…
misalnya data menyebar poisson pake transformasi sqrt(Y), klo data menyebar binomial atau proporsi pake transformasi sin pangkat min satu (sqrt(Y)) dll…
30 April 2008 at 4:18 pm
Saya seorang mahasiswa yang sedang melakukan penelitian dengan judul
“Pengaruh Pelatihan terhadap peningkatan produktivitas kerja karyawan”
Dalam penelitian ini saya memutuskan untuk menggunakan program SPSS 16.0
Saya sudah membeli buku SPSS 16.0 yg diterbitkan Pustaka Pelajar dan ditulis oleh
Hartono
Variabel penelitian Saya :
X = Pelatihan (kemudian dibagi menjadi X1, X2, X3)
Yaitu :
X1= On the job
X2= Vestibule
X3= Demonstration and example
Y = Produktivitas
Namun saya menemukan beberapa kebingungan dalam memakai cara cara yang ada
didalam buku tersebut. Yaitu :
1. menghitung korelasi ganda/parsial dengan menggunakan 3 prediktor (pengaruh
X1, X2, X3 terhadap Y),
Apakah bisa dihitung langsung dengan menggunakan SPSS
2. Untuk uji signifikasi koefisien korelasi ganda (Uji F),
Apakah menggunakan Anova 1 arah atau 2 arah ?
3. Untuk Uji t, apakah saya harus menggunakan Test t untuk sampel-sampel yang
berkolerasi, atau
apakah saya harus menggunakan Test t untuk sampel-sampel yang tidak berkolerasi
Kalau bisa Saya minta no HPnya donk, untuk konsultasi
Terima kasih
Salwantobayu@gmail.com
2 Mei 2008 at 11:08 am
Terima kasih juga udah bertanya di sini.
Saya belum menangkap masalah yg ditanyakan. Saya baru ngerti kalau “korelasi” itu adalah “regresi”. Baik, kita asumsikan seperti itu, maka jawabannya…
1. Bisa
2. Satu arah saja
3. Semua sample (baris) kita olah karena itulah data kita yg sangat berharga. Maka jangan sampai dengan mudahnya kita mengeluarkan sample dari analisis. Sayang.
OK. Saya tak punya buku itu, tapi coba deh baca yg bagian regresi atau regresi berganda. Di SPSS ada di bagian Analyze > Regression > Linear…
Anda dari Jogja ya… Di UGM kan ada jurusan Statistika-nya. Coba aja hubungi mahasiswa-nya, harusnya ada yg provide analisis statistika buat mahasiswa, daripada harus berkonsultasi dengan saya di Jakarta. Mudah2an penelitiannya lancar…
5 Mei 2008 at 6:07 pm
mau tanya: yang paling penting mana R-square tinggi atau model BLUE? thx
F-Xtudent said:
Sebenernya dua2nya penting, tapi kalau tak bisa bagus dua2nya bergantung pada tujuan modelingnya, kalau untuk forecasting R-Square tinggi itu bagus karena keragaman respon dapat dijelaskan oleh keragaman variabel independen. Kalau modelingnya untuk mencari variabel independen mana yg berpengaruh, maka utamakan BLUE. CMIIW
6 Mei 2008 at 10:04 am
apa judul yang bagus nih
9 Mei 2008 at 9:03 am
mau tanya lagi : apa HP filter dapat meningkatkan R-square? Yang di ambil HP filter non tren atau tren? Thx
9 Mei 2008 at 9:09 am
Tanya sekali lagi… Jika ada masalah heteroskedastisitas apakah sangat mengganggu dalam menentukan Y dugaan? Dalam model saya terdapat hetero yang tidak bisa dihilangkan karena memang data sangat volatil. Data yang mengandung hetero tidak bisa dihilangkan karena model ini akan digunakan untuk perbandingan berbagai negara. Usaha transformasi data, WLS, dan perubahan model (mis ECM, VAR) tidak merubah keadaan. Sedangkan bila menggunakan ARCH GARCH justru meningbulkan masalah baru (autokorelasi). Minta sarannya… Thx…
9 Mei 2008 at 10:48 am
Mba Titis makasih udah nanya di sini. Tapi untuk modeling, saya bukan ahlinya, mudah2an ada yg bertanggungjawab (yg mendalami modeling tapi bukan celebrities) mau jawabin. Soalnya saya lebih mendalami komputasi, instead of modeling.
Dalam prakteknya sih, kalau emang masalah2 tak dpt dihindarkan, “hajar aja bleh!” (ini kalimat yg suka diucapkan senior saya yg econometrician kalau melanggar teori). Asal hasilnya ngga melenceng dr hipotesis kita sih masih OK lah.
Maaf, yg HP filter saya ngga ngerti.
13 Mei 2008 at 8:49 pm
Tulisan yang bagus. Ingin nanya sedikit tentang konsep random variable (peubah acak). Pada tulisan anda disinggung mengenai peubah acak yang memiliki sebaran identik dan saling bebas (independent and identically distributed) . Sepertinya ini masuk materi statistik terapan yach krn saat2 belajar MK Random Variable ini tidak dipelajari. Barangkali bisa diberikan contoh2 real agar membantu mempermudah. Terima kasih
Salam kenal,
Filial Fahri
TE-UAI
14 Mei 2008 at 9:06 am
Masa sih…. seringnya malah ketika membicarakan random variabel selalu membahas random variabel iid itu. Saya juga ga terlalu ngerti mba/mas* Filial, coba tanya aja ke yg nulisnya langsung di blognya http://bagusco.blogspot.com
*coret yg tidak perlu
19 Mei 2008 at 9:36 am
Makasi buat jawabannya… Sangat membantu…
Mau bagi info saja, klo pake HP filter (smoothing) yang di pake tren nya… Terbukti bisa menghilangkan hetero pada data2 yang volatilitasnya tinggi…
Salam kenal,
Tities
IE 41 IPB
19 Mei 2008 at 10:03 am
Salam kenal juga…
Membantu kah jawaban saya? Mmhh…..
BTW IE itu kepanjangan dari apa sih?
20 Mei 2008 at 7:47 pm
Ilmu Ekonomi mungkin..(CMIIW)
23 Mei 2008 at 6:23 pm
Ilmu Ekonomi mas… Dept IE baru di buka 8 tahun terakhir ini… Aku angkatan ke 5..
Sekarang lg skripsi. Aku anak bimbin Pak Noer Azam Achsani. Beliau juga dulu dari statistik IPB. Kenalkah?
26 Mei 2008 at 8:33 am
Mmhhh… berarti IE udah ada sedari angkatan saya dong…
Pak Noer Azam, saya ga kenal, angkatan tua pasti.
31 Mei 2008 at 7:46 pm
Mas, saya mau nanya…sebenarnya uda ada pertanyaannya di atas, tp saya blom ‘ngeh’. Maap..hehehe.
Mas, kalo saya mo analisis faktor, kan asumsinya data harus berdistribusi normal, sedangkan data saya kan data ordinal (skala likert), nah itu uda saya coba pake SPSS ga normal. Itu solusinya gmn ya? ato saya abaikan saja, atau data tersebut bisa ditransformasikan (normalitas atao apa itu)?Makasi banyak.
12 Juni 2008 at 12:07 pm
Pak, saya mo tanya. Klo penelitian kita variabel dependennya dalam bentuk jutaan rupiah dan independennya dalam bentuk persentase, apakah bisa diregresikan? Ada yang mengatakan tidak bisa, harus di LN-kan dulu dalam spss baik dengan double log atau semi log, baru bisa diregres. Benarkah pendapat itu? Terima kasih
ipk4cumlaude said:
Ga usah dilonkan dulu atuh, yg jutaannya dipangkas aja nolnya misalnya 7000000 jadi 7 aja. Dan yg 8.5% jadi 8.5 aja. Kalau emang 2 variabel, tinggal dibikin plotnya aja… kalau garisnya melengkung berarti harus ada variabel yg ditransformasi.
16 Juni 2008 at 8:00 pm
pusing..pusing.. saya mau nanya jadi bingung cara nanyanya….
makasih ya.. ikut ngebaca jawaban di atas..
8 Juli 2008 at 11:36 am
tolong tanya mengenai solusi bila data tidak memenuhi uji heterokedastisitas sebaiknya bagaimana? saya bingung sekali. terima kasih
ipk4cumlaude said:
Yuna, silakan baca di postingan ini: Mengatasi Heteroskedastisitas . Mudah2an ngerti, kalau ngga ngerti, ngacung aja di Monas!
22 Juli 2008 at 5:52 am
saya mau tanya donk, apa bener klo penelitian pakai variabel moderasi ga perlu nguji multikolinearitas, krn klo tetep diuji bakal jadi multikol? Tlng donk dijawab sy pusing bgt nich
mang kumlod said:
variabel moderasi itu apa yak. Duh maap ga ngerti….
31 Juli 2008 at 6:32 pm
saya sedang menyelesaikan skripsi tapi masih bingung di pengolahan datanya…tolong bantuin ya…maaf kalau pertanyaannya rada bego…
judul skripsi saya “peranan audit internal dalam meningkatkan kepatuhan pelaksanaan sistem manajemen kualitas ISO 9001:2000″. saya memakai program SPSS 16.0 dan memakai kuesioner…
berarti kn data saya masih berupa skala ordinal…apa itu harus ditransformasikan lagi ke skala nominal ya?? kalau ditransformasikan pake apa ya? apa pake Method of Successive Interval Method? gimana cara pemakaiannya metode itu ya?
apa ga bisa langsung dimasukkin aja nilai dari masing-masing responden ke SPSS dan langsung diuji validitas, normalitas dan reliabilitasnya?
saya masih bingung banget dengan transformasi data ordinal ke nominal…..sampel saya sebanyak 71 responden…kapan kita memakai uji t 1 arah, 2 arah, uji F ya??kapan harus pake ANOVA??
tolong bantuin saya yaa….uda dateline sidang pertengahan bulan ini euy….makasi sebelumnya
mang kumlod said:
. Tapi kalau pertanyaannya kayak gini mah, jelasinnya harus satu semester sendiri atuh.
Terimakasih dah berkunjung ke sini. Anda tepat sekali bertanya pada orang statistik
Biasanya sih, pas saya mhs, mahasiswa yg lagi penelitian, baik yg belum mepet maupun yang sudah mepet, suka minta bantuan sama anak statistika. Nah, lebih baik cari anak statistika atau kampus yg ada jurusan statistikanya, minta bantuan sama mereka. Kalau di IPB, konsultan statistika sudah semakin profesional. Saran saya ya seperti itu, cuz kalau saya jelasin di sini panjang lebar juga bakalan susah. Saya aja yg anak statistika butuh belajar 3 tahun untuk mengerti kayak gini. OK, buanamonica! Mudah2an penelitiannya lancar.
5 Agustus 2008 at 11:39 am
salam kenal,
saya sedang menyelesaikan skripsi yang berjudul “Pengaruh Kecerdasan Emosional Terhadap Prestasi Belajar”.
skrg sedang tahap uji asumsi klasik.
setelah melakukan uji heteroskedastisitas, ternyata pada data saya terdapat masalah heteroskedastisitas, tapi lolos uji normalitas n multikolinearitas.
adakah argumen dr buku atw artikel yg menyatakan bhw data yg heteroskedastisitas dapat diabaikan???
(dosen pembimbing saya menyarankan demikian)
krn sulit bagi saya untuk menyelesaikan rumus matematika seperti yg ada dalam artikel Anda yg berjudul Mengatasi Heteroskedastisitas.
tlng dibantu.
trima kasih.