Paket Program SPSS Inferensia Statistikpusdiklat.bps.go.id/diklat/bahan_diklat/BA_Paket Program...
Transcript of Paket Program SPSS Inferensia Statistikpusdiklat.bps.go.id/diklat/bahan_diklat/BA_Paket Program...
B A H A N A J A R
Paket Program SPSS
Inferensia Statistik
Disusun oleh:
Budi Subandriyo, S.ST, M.Stat
Diklat Fungsional Statistisi Tingkat Ahli – BPS Angkatan XXI
Jakarta, Februari 2020
1 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Statistika dan Penelitian Ilmiah
Menurut Kerlinger (1986), mendefinisikan penelitian ilmiah menjadi suatu penyelidikan
yang sistematis, terkontrol, empiris, dan kritis tentang fenomena-fenomena alami dengan
dipandu teori dan hipotesis-hipotesis tentang hubungan yang diperkirakan terdapat diantara
fenomena-fenomena tersebut. Penelitian ilmiah adalah penelitian terhadap sampel (contoh),
tetapi kesimpulannya akan digeneralisasikan pada populasi dimana sampel diambil. Jadi
penelitian ilmiah sebagai mengungkapkan dugaan/hipotesis yang terjadi pada hubungan antar
variabel penelitian.
Ketika penelitian pada sampel telah dilaksanakan, maka akan dihasilkan data. Data yang
terkumpul, kemudian analisis dengan metode statistik dan hasilnya akan digeneralisasikan pada
populasi. Dengan demikian, statistika juga dapat diartikan sebagian suatu cara untuk memahami
populasi berdasarkan informasi yang diperoleh dari sampel.Tingkat keandalan generalisasi suatu
hasil uji statistik pada sampel dinyatakan dalam taraf signifikasi. Seorang peneliti harus menyadari
bahwa sampel yang diambil, sedikit atau banyak, pasti mengandung unsur kesalahan sampling)
sampling error.
Sumber sampling, antara lain: populasi yang ada tidak pernah homogen secara sempurna
dan juga dapat dipengaruhi karena kekuranganmampuan peneliti dalam menyusun instrumen
yang benar-benar bebas kesalahan (Nisfiannoor, 2009:3). Menurut Herinaldi (2005:2) Secara
umum statistik adalah suatu metode-metode ilmiah dalam mengumpulkan, mengklasifikasikan,
meringkas, menyajikan, menginterprestasikan, dan menganalisis data guna mendukung
pengambilan kesimpulan yang valid dan berguna sehingga dapat menjadi dasar pengambilan
keputusan yang masuk akal.
Statistik dan Parameter
Dalam penelitian, istilah statistik digunakan apabila yang dibicarakan adalah ukuran
sejumlah sampel, sedangkan istilah parameter digunakan untuk menunjukan ukuran populasi
yang ada. Ukuran membedakan apakah ukuran yang diambil merupakan data dari sampel atau
data dari populasi, maka digunakan simbol-simbol tertentu untuk membedakan antara statistik
dan parameter. Simbol huruf untuk statistik berasal dari huruf-huruf latin, sedangkan untuk
parameter digunakan huruf-huruf Yunani. Berikut ini merupakan beberpa contoh simbol yang
2 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
dipergunakan untuk statistik dan parameter :
Statistik Parameter Keterangan
N N Banyaknya subjek
X μ Rata-rata (mean)
S σ Simpangan baku (standar deviasi)
S2 σ2 Varians
Analisis statistik terhadap satu perlakukan yang dimaksud disini adalah analisis secara
statistik untuk menguji hipotesis yang berkenaan dengan kualitas sebuah perlakuan (seperti,
baik/jelek, berhasil/gagal, memuaskan/mengecewakan) atau rata-rata normal/tidak normalnya.
Menurut Santoso (2010:10), pada prinsipnya ilmu statistik bisa diartikan sebagai sebuah
kegiatan untuk Mengumpulkan data, Meringkas/menyajikan data, Menganalis data dengan
metode tertentu, menginterprestasi hasil analisis tersebut.
Dalam kehidupan sehari-hari Secara metode, ilmu statistik dibagi menjadi dua bagian
yaitu statitsik desktiptif dan statistik inferensi
Statistik Deskriptif/Deduktif
Statistik deskriptif, yaitu metode statistik yang digunakan untuk mengumpulkan,
meringkas, menyajikan, dan mendekripsikan data sehingga dapat memberikan informasi yang
berguna. Data yang disajikan dalam statistika deskriptif biasanya dalam bentuk ukuran
pemusatan data (mean, median, dan modus), ukuran penyebaran data (standar deviasi dan
varians), tabel, serta grafik (histogram, pie, dan bar) (Nisfiannoor, 2009:4).
Sedangkan menurut Santoso (2010:2) mengemukakan statistik deskriptif menjelaskan
bagaimana data dikumpulkan dan diringkas pada hal-hal yang penting pada data tersebut.
Kegiatan yang berhubungan dengan statistik deskriptif seperti menghitung mean (rata-rata
hitung), media, modus, mencari sdeviasi standar, melihat kemencengan distribusi data, dan
sebagainya.
Tahapan statistik yang meliputi kegiatan mengumpulkan, mengklasifikan, meringkas,
menginterprestasikan, dan menyajikan data dari suatu kelompok yang terbatas, tanpa
mengaalisis dan menarik kesimpula yang bisa berlaku bagi kelompok yang lebih luas merupakan
ruang lingkup dari statistik deskriptif atau statistik deduktif( Herinaldi, 2005:4).
3 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Statistik inferensi/statistik induktif
Statistik inferensial yaitu metode yang berhubungan dengan analisis data pada sampel
dan hasilnya digunakan untuk generalisasi terhadap populasi. Penggunaan statistik inferensial
didasarkan pada peluang (probability) dan sampel yang dianalisi diperoleh secara acak (random).
Naga (2008) menyatakan bahwa tugas dari statitika inferensial adalah melakukan estimasi,
menguji hipotesis, dan mengambil keputusan (Nisfiannoor, 2009:4). Sedangkan menurut Santoso
(2010:2), mengatakan setelah data dikumpulkan, dilakukan berbagai metode statistik untuk
menganalisi data, kemudian menginterprestasikan hasil analisis tersebut. Kegiatan penting yang
terkait dengan proses inferensi adalah uji beda data uji hubungan antara dua variabel data;
metode yang sering ditemui adalah uji-t, pembuatan model regresi, anova dan statistik
parametrik maupun non parametrik.
Proses pengambilan kesimpulan mengenai parameter populasi (biasanya adalah kuantitas
yang tidak diketahui nilainya) berdasarkan informasi yang diperoleh dari statistik sampel
(kuantitas yang diketahui nilainya) merupakan ruang lingkup dari statistik inferensial atau statistik
induktif (Herinaldi, 2005:4)
Konsep statistik inferensial memungkinkan seorang melakukan analisis dengan
menggunakan data dari sampel untuk memperkirakan (mengetimasi) sebuah parameter populasi
yang tidak diketahui. Karena pengambilan kesimpulan dengan cara seperti itu tidaklah mutlak
Gambar proses inferensi secara statistik
4 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
kepastiannya, maka kata “kemungkinan/probabilitas” sering digunakan dalam menyatakan
kesimpulan. Dalam kaidah pengeambilan kesimpulan secara statistik yang akan dibahas
kemudian, pernyataan “kemungkinan/probabilitas” ini tersirat dalam termilogi “derajat
keercayaan (level of confidance)”.
Statistika inferensial dapat digolongkan
menjadi dua, yaitu:
1) Statistik parametrik
Penggunaan teknik statistik parametrik didasarkan pada didasarkan pada asumsi bahwa
data yang diambil mempunyai distribusi normal dan jenis data yang digunakan interval atau rasio.
2) Statistika nonparametrik
Penggunaan statistika nonparametrik tidak megharuskan data yang diambil mempunyai
distribusi normal dan jenis data yang digunakan dapat nominal dan ordinal.
a. Penggolongan analisis statistik parametrik dan nonparametrik
Pada dasarnya, baik statistik parametrik maupun nonparametrik dapat digunakan untuk
analisis statistik yang bersifat:
1) Korelatif
Teknik analisis korelatif digunakan untuk mengetahui hubungan atau korelasi dari sebuah
variabel yang lain. Misalnya variabel X dan variabel Y. Teknik analisis yang sering dipakai adalah
korelasi Pearson dan regresi.
2) Komparatif
Teknik analisis komparatif digunakan untuk mengetahui perbedaan nilai rata-rata dari
suatu kelompok dengan kelompok lainya. Misalnya perbedaan kecemasan antara kelompok pria
dan wanita, serta perbedaan motivasi kerja antara bagian produksi, pemasaran, dan keungan.
Teknik analisis yangsering digunakan adalah T-test dan anova.
5 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Menurut Santoso (2010:2), mengatakan dari sudut pandang statistik, data bisa dibagi
menjadi:
Data Kualitatif
Data kualitatif adalah sebuah data yang dinyatakan dalam bentuk bukan angka. Sebagai
Spearman
kendal, Kai
Kuadrat dll.
-Normal,
Interval;
rasio
Non-Normal,
Nominal,
ordinal
Mann-whitney,
Kruskal-
wallis,dll
Statistika
Deskriptif
Inferensia
Parametrik
Nonparametrik
Korelatif
Komparatif
Korelatif
Komparatif
Univariat
Multivariat
2 Sampel
K sampel
2 sampel
K Sampel
Univariat
Multivariat
Pearson,
Regresi
T-test, Anava
Jenis-jenis Statistika dan Teknik Analisinya
6 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
contoh: jenis pekerjaan seseorang (bisa petani, Nelayan, Pegawai dan sebagainya), status
pernikahan (belum menikah, menikah Duda, janda), Gender (Pria, Wanita), kepuasan sesorang
(tidak Puas, Cukup Puas, sangat Puas) dan sebagainya. Data jenis ini harus dikuantifikasi agar
bisa diolah dengan statistik.
Data Kuantitatif
Data kuantitatif adalah data yang dinyatakan dalam bentuk angka. Sebagai contoh: usia
seseorang, tinggi badan seseorang, tingkat penjualan barang X dalam sebulan, jumlah bakteri
dalam sebuah percobaan biologi tertentu dan sebagainya.
Perbedaan statistik parametrik dan statistik non parametrik
o Statistik Parametrik:
− Teknik-teknik statistika yang didasarkan atas asumsi mengenai populasi yang
diambil sampelnya.
− Contoh: pada uji t diasumsikan populasi terdistribusi normal.
− Sebutan parametrik digunakan karena pada uji t ini yang diuji adalah parameter
(contoh: rata-rata populasi)
DATA
JENIS
DATA
-Nominal
-Ordinal
-Interval
-Rasio
KUANTITATIF KUALITATIF
Data kualitatif tidak berupa angka, sedangkan statistik hanya bisa memproses data
yang berupa angka. Karena itu, data kualitatif harus dikuantifikasi atau diubah menjadi
data kuantitatif. Pengubahan bisa dengan cara memberi skor tertentu (seperti Pria diberi
skor 1, sementara wanita diberi skor 2), memberi rangking (tidak puas 1, puas 2 dan
seterusnya) dan sebagainya.
7 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
− Membutuhkan data kuantitatif dengan level interval atau rasio
o Statistik Non Parametrik:
− Cocok untuk data yang tidak memenuhi asumsi statistika parametrik atau yang
berjenis kualitatif
− Disebut juga distribution-free statistics
− Didasarkan atas lebih sedikit asumsi mengenai populasi dan parameter
dibandingkan dengan statistika parametrik
− Ada yang dapat digunakan untuk data nominal
− Ada yang dapat digunakan untuk data ordinal
Uji Normalitas
Subana & Sudrajat (2000:123) mengatakan bahwa menguji normalitas data kerapkali
disertakan dalam suatu analisis statistika inferensial untuk asatu atau lebih kelompok sampel.
Normalitas sebaran data menjadi sebuah asumsi yang menjadi syarat untuk menentukan jenis
statistik apa yang dipakai dalam penganalisa selanjutnya.
Asumsi normalitas senantiasa disertakan dalam penelitian pendidikan karena kaitannya
dengan sifat dari subjek/objek penelitian pendidikan, yaitu berkenaan dngan kemampuan
seseorang dalam kelompoknya. Galton, seorang ahli dalam teori pembelajaran, mengatakan
bahwa: apabila sejumlah anak/orang dikumpulkan dalam sebuah kelas kemudian diukur
kemampuannya (kekepandaian ,kebiasaan, ketrampilan), hasil pengukuurannya yang berupa
skor kemampuan akan beristribusi menyerupai kurva normal.
Meskipun demikian, apabila sebaran data suatu penelitian yang mengungkapkan
kemampuan siswa ternyata diketahui tidak normal hal itu bukan berarti harus berhenti penelitian
itu sebab masih ada fasilitas statistik nonparametrik yang dapat dipergunakan apabila data tadi
tidak berditribusi normal.
8 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak,
sebaiknya digunakan uji statistik normalitas. Karena belum tentu data yang lebih dari 30 bisa
dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30 belum
tentu tidak berdistribusi normal, untuk itu perlu suatu pembuktian. uji statistik normalitas yang
dapat digunakan diantaranya Chi-Square, Kolmogorov Smirnov, Lilliefors, Shapiro Wilk, Jarque
Bera.
2.4. Statistik Parametrik
Menurut Sulaiman ( 2005:1) mengatakan Tes parametrik adalah suatu tes yang modelnya
menetapkan syarat-syarat tertentu tentang parameter populusai yag menjadi sama penelitiannya.
Terhadap syarat-syarat tersebut biasanya tidak dilakukan pengujian terlebih darhulu dan
dianggap sudah memenuhi syarat. Seberapa jauh makna hasil tes parametrik tersebut tergantung
pada validitas anggapan tadi. Tes-test parametrik juga memnuntut bahwa nilai-nilai yang
dianalisis merupakan hasil dari suatu pengukuran minimal dengan skala interval.
Sugiyono (2013:79) mengemukakan statistik parametris itu bekerja berdasarkan asumsi
bahwa data setiap variabel yang akan dianalisis berdasarkan berdistribusi normal. Untuk itu
sebelum peneliti menggunkan teknik statistik parametris, maka kenormalan data harus diuji
terlebih dahulu. Bila data tidak normal, maka statitik parametris tidak dapat digunakan, untuk itu
Metode untuk mengetahui suatu set data memiliki distribusi normal
atau tidak menurit Dahlan (:200513)
9 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
perlu digunakan statistik nonparametris. Tetapi perlu diingat bahwa yang menyebabkan tidak
normal itu apanya. Misalnya ada kesalahan instrumen dan pengumpulan data, maka dapat
mengakibatkan data diperoleh menjadi tidak akan normal. Supardi (2013:8) mengatakan Statistik
parametrik adalah bagian statistik yang parameter populasinya harus memnuhi syarat-syarat
tertentu seperti syarat data berkala intervak/rasio, styarat penagambilan sampel harus random,
berdisribusi normal atau normalitas dan syarat memiliki varian yang homogen ata homogenitas,
model regsi lineier, dan sebagainya. Dalam statistika parametrik, inidikator-indikator yang
dianalisis adalah parameter-parameter dari ukuran objek yang digunakan. Menurut
(Nisfiannoor,2009:15) mengatakan statistik inferensial dengan model parametrik (independent
Sample T test, Paired Sample T test, One Way ANOVA, Korelasi Pearson, Analisis Regresi, dll.
Beberapa metode statistik parametrik (uji T dan Uji F/Anova) mensyaratkan asumsi
(Santoso, 2005:3) :
Sampel (data) diambil dari populasi yang mempunyai berdistribusi normal. Jika 10
sampel Tinggi badan diambil dari populasi 5000 mahasiswa sebuah perguruan tinggi, data tinggi
badan 5000 mahasiswa haruslah berdistribusi normal.
Pada Uji t dan uji F untuk dua sampel atau lebih, kedua sampel diambil dari dua
populasi yang mempunyai varian sama. Jadi jika diambil sampel 10 tinggi badan pria dan 10
tinggi badan wanita dari 3000 pria dan 2000 wanita, maka varian 3000 tinggi badan pria dan
varian 2000 tinggi badan wanita harusla sama atau bisa diangga sama.
Variabel (data) yang diuji haruslah data bertipe interval atau rasio, yang
tingkatannya lebih tinggi dari data tipe nominal atau ordinal. Tinggi Badan Pria atau Wanita
(sentimeter) jelas bertipe rasio, karena dapat dari proses mengukur. Namun pendapat atau sikap
pria dan wanita (suka atau tidak suku yang diukur dengan skala Likert) bukanlah data interval
atau rasio, namun data Ordinal.
Jumlah (sampel) data singkat kecil, sedangkan distribusi data populasinya tidak
diketahui kenormalannya. Mislanya hanya diambil masing-masing 5 sampel untuk data Berat
Badan Knosumen remaja, Konnsumen Mud dan konsumen Dewasa, maka jumlah data terlalu
sedikit untuk diproses dengan uji F (uji lebih dari dua sampel), walaupun tipe data rasio.Untuk
data yang tidak memenuhi salah satu asumsi tersebut, lebih baik menggunakan prosedur statistik
non parametrik untuk proses data.
Menurut Santoso(2010:10) Metode statistik parametrik digunakan untuk:
Data dalam jumlah besar, biasanya diatas 30.
10 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Distribusi data adalah normal atau dapat dianggap normal
Data bertipe interval atau rasio.
Jika salah satu asumsi diatas tidak terpenuhi, seperti jika data cukup banyak, namun tidak
berdistribusi normal, atau tipe data adalah nominal atau ordinal, maka metode statistik
nonparametrik dapat digunakan.
Dengan demikian, metode parametrik secara natur lebih kuat (powerful) dibanding
nonparametrik; jika pada data yang sama dilakukan pengolahan data dengan metode parametrik
kemudian nonparametrik, dan keduanya mengahsilkan kesimpulan yang berbeda, maka hasil dari
metode parametrik dapat jadi patokan. Pada umumnya, penggunaan metode parametrik
dijadikan alternatif awal untuk mengolah data; jika data memang tidak dapat diolah dengan
parametrik, maka barulah digunakan metode nonparametrik.
Namun demikian, dalam praktik banyak data atau kasus yang justru tidak bisa memenuhi
kritera pengguna metode paramerik. Karena itu berkembanglah sejumlah besar metode statistik
nonparametrik untuk inferensi pada data yang tidak memenuhi syarat parametrik. Walaupun tidak
powerful seperti metode parametrik, namun pengguna metode nonparametrik dalam praktik
sangat membantu banyak pengambilan keputusan secara statistik.
Statistik Inferensi dalam SPSS
SPSS menyediakan berbagai metode parametric untuk melakukan inferensi terhadap data
statistic. Menu yang dapat dipakai untuk inferensi yaitu menu ANALYZE > COMPARE MEANS.
Pembahasan pada COMPARE MEANS meliputi :
1) MEANS
Bagian ini membahas hal yang sama pada statistic deskriptif dengan penyajian subgroup dan
ditambah dengan uji linieritas.
2) T TEST
Bagian ini membahas uji t yang meliputi :
Uji t satu sample
Uji t untuk sampel independen
Uji t untuk dua sampel berpasangan
3) ANOVA
Jika uji t digunakan untuk uji terhadap dua sample, maka uji ANOVA membahas uji untuk
lebih dari dua sampel.
11 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
1. Paired Sampel T Test (T Test untuk Sampel yang Berpasangan)
Sampel yang berpasangan artinya sampel dengan subyek yang sama namun mengalami dua
perlakuan atau pengukuran yang berbeda.
Kasus:
Produsen Obat Diet ingin mengetahui apakah obat yang diproduksinya benar-benar mempunyai
efek terhadap penurunan berat badan konsumen. Untuk itu, sebuah sampel yang terdiri atas 10
orang masing-masing diukur berat badannya, dan kemudian setelah sebulan meminum obat
tersebut, kembali diukur berat badannya.
Berikut hasilnya (angka dalam satuan kilogram) :
Penyelesaian :
1) Penciptaan Variabel ke SPSS
Variabel Sebelum
Nama : sebelum
Type : numeric
Width : 8
Decimals : 2
Label : Berat Sebelum
No. Sebelum Sesudah
1 76.85 76.22
2 77.95 77.89
3 78.65 79.02
4 79.25 80.21
5 82.65 82.65
6 88.15 82.53
7 92.54 92.56
8 96.25 92.33
9 84.56 85.12
10 88.25 84.56
12 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Variabel Sesudah
Nama : sesudah
Type : numeric
Width : 8
Decimals : 2
Label : Berat Sesudah
2) Pengisian Data
Dari menu utama SPSS, pilih menu Analyze, kemudian pilih submenu Compare-Means.
Dari serangkaian pilihan yang ada, pilih Paired-Samples T Test…
Klik pilihan tersebut, sehingga tampak di layar :
Paired Variable(s) atau variabel yang akan diuji. Oleh karena yang akan duji adalah
variabel sebelum dan sesudah, maka klik variabel sebelum dan sesudah sehingga
nampak pada kolom Current Selection. Kemudian, klik tanda panah.
Pilih button Option, sehingga tampak :
Untuk Confidence Interval (tingkat kepercayaan): diisi 95%
Oleh karena tidak ada data yang hilang, maka Missing values tetap pada default SPSS.
13 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Tekan Continue jika pengisian telah selesai.
Kemudian klik OK untuk menampilkan output. Sehingga tampil output berikut:
3) Analisis
Output bagian pertama
Bagian pertama merupakan ringkasan dari statistic dari kedua sampel. Untuk berat badan
sebelum minum obat, konsumen mempunyai berat rata-rata 84.5100 Kg. Sedangkan
setelah minum obat, konsumen mempunyai berat rata-rata 83.3090 Kg.
Output bagian kedua
Output kedua menyatakan korelasi atau hubungan antara sampel yang berpasangan. Pada
tabel terlihat angka korelasi sebesar 0.943 yang berarti bahwa hubungan antara sampel
yang berpasangan sangatlah erat.
Output bagian ketiga
o Hipotesis
H0=Kedua rata-rata Populasi adalah identik
H1=Kedua rata-rata Populasi adalah tidak identik
Paired Samples Statistics
84.5100 10 6.63931 2.09953
83.3090 10 5.58235 1.76530
berat sebelum
berat sesudah
Pair
1
Mean N Std. Deviation
Std. Error
Mean
Paired Samples Correlations
10 .943 .000berat sebelum &
berat sesudah
Pair
1
N Correlation Sig.
Paired Samples Test
1.2010 2.30738 .72966 -.4496 2.8516 1.646 9 .134berat sebelum -
berat sesudah
Pair
1
Mean Std. Deviation
Std. Error
Mean Lower Upper
95% Confidence
Interval of the
Difference
Paired Differences
t df Sig. (2-tai led)
14 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
o Pengambilan Keputusan
- Berdasarkan perbandingan t hitung dengan t tabel
Jika t hitung > t tabel, maka H0 ditolak
Jika t hitung < t tabel, maka H0 diterima
t hitung = 1.646
t tabel = 2.2622
Oleh karena t hitung < t tabel, maka Ho diterima dengan kesimpulan bahwa obat
tersebut tidak efektif dalam menurunkan berat badan.
- Berdasarkan nilai probabilitas
Jika probabilitas > 0.05, maka H0 diterima
Jika probabilitas < 0.05, maka H0 ditolak
Terlihat bahwa t hitung adalah 1.646 dengan probabilitas 0.134. Oleh karena
probabilitas > 0.05, maka H0 diterima, atau berat badan sebelum dan sesudah
minum obat relatif sama. Dengan kata lain, obat penurun badan tersebut tidak
efektif dalam menurunkan berat badan.
2. One Sample T Test
Pada prinsipnya, uji T dengan satu sample ingin menguji apakah suatu nilai tertentu (yang
diberikan sebagai pembanding) berbeda secara nyata ataukah tidak dengan rata-rata sebuah
sampel.
Kasus:
No. Sebelum
1 76.85
2 77.95
3 78.65
4 79.25
5 82.65
6 88.15
7 92.54
8 96.25
9 84.56
10 88.25
15 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Dari kasus terdahulu, diketahui bahwa populasi rata-rata berat sebelum minum obat adalah
84,51. Sekelompok anak muda setelah ditimbang mempunyai rata-rata berat badan 90 kg. Apaka
sekelompok anak muda ini mempunyai berat yang tidak sama secara signifikan dengan rata-rata
berat sampel sebelum minum obat?
Penyelesaian:
Kasus di atas terdiri dari satu sampel yang akan dipakai dengan nilai populasi hipotesis, yaitu 90
kg. Disini populasi diketahui berdistribusi normal dan karena sampel sedikit, dipakai uji T untuk
dua sampel yang berpasangan.
1) Pemasukkan data ke SPSS
Cara memasukkan data sama dengan cara yang telah diajarkan kemarin.
2) Pengolahan Data
Langkah-langkah :
Buka lembar kerja kerja/file uji_t_paired
Dari menu utama, pilih Analyze > Compare Means > One Sample T Test… sehingga
tampak :
Pengisian :
Pada field Test variabel(s) diisi dengan variabel sebelum.
Pada textbox Test Value ketik 90 sesuai nilai hipotesis
Klik button Option, sehingga tampak :
16 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
One-Sample Test
-2.615 9 .028 -5.4900 -10.2395 -.7405berat sebelum
t df Sig. (2-tailed)
Mean
Difference Lower Upper
95% Confidence
Interval of the
Difference
Test Value = 90
Pengisian :
Confidence Interval/Tingkat kepercayaan. Secara default disediakan tingkat kepercayaan
95%
Untuk Missing Values atau data yang hilang. Karena data yang ada lengkap maka biarkan
pilihan Exlude cases anaysis by analysis
Tekan Contnue untuk menyelesaikan pengisian dan OK untuk mengakhiri prosedur analisis.
3) Analisis
Output bagian pertama
Terlihat adanya ringkasan statistic dari variabel Sebelum. Untuk berat badan sebelum minum
obat, konsumen mempunyai berat rata-rata 84.5100 kg
Output bagian kedua
Hipotesis:
H0 = Berat kelompok anak muda tidak berbeda dengan rata-rata berat populasi sebelum
minum obat
H1 = Berat kelompok anak muda berbeda dengan rata-rata berat populasi sebelum
minum obat
Pengambilan Keputusan:
- Berdasarkan perbandingan t hitung dengan t tabel :
One-Sample Statistics
10 84.5100 6.63931 2.09953berat sebelumN Mean Std. Deviation
Std. Error
Mean
17 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Jika Statistik hitung (angka t output) > Statistik Tabel (tabel t), maka H0 ditolak.
Jika Statistik hitung (angka t output) < Statistik Tabel (tabel t), maka H0 diterima.
T hitung dari output adalah -2,615
Sedang statistic tabel dapat dihitung pada tabel t:
Tingkat signifikansi )( adalah (100-95)% = 5%
Df atau derajat kebebasan adalah n(jumlah data)-1 atau 10-1=9
Uji dilakukan dua sisi sesuai output.
- Berdasarkan nilai probabilitas
Jika probabilitas > 0,05, maka H0 diterima
Jika probabilitas < 0,05, maka H0 ditolak
Keputusan:
Terlihat bahwa t hitung adalah -2,615 dengan probabilitas 0,028. Oleh karena probabilitas <
0,05, maka H0 ditolak atau berat kelompok anak muda tersebut memang berbeda dengan
berat rata-rata populasi sebelum minum obat.
3. Independent Sample T Test
Independent sample T test adalah uji T untuk dua sampel independen (bebas)
Kasus:
Seorang peneliti ingin mengetahui apakah ada perbedaan antara tinggi dan berat badan seorang
pria dan seorang wanita. Untuk itu, 7 pria dan 7 wanita masing-masing diukur tinggi dan berat
badannya.
Berikut data yang didapat :
No. Tinggi Berat Gender
1 174.5 65.8 Pria
2 178.6 62.7 Pria
3 170.8 66.4 Pria
4 168.2 68.9 Pria
5 159.7 67.8 Pria
6 167.8 67.8 Pria
18 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
7 165.5 65.8 Pria
8 154.7 48.7 Wanita
9 152.7 45.7 Wanita
10 155.8 46.2 Wanita
11 154.8 43.8 Wanita
12 157.8 58.1 Wanita
13 156.7 54.7 Wanita
14 154.7 49.7 Wanita
Penyelesaian:
Kasus di atas terdiri atas dua sampel yang bebas satu dengan yang lain, yaitu sampel bergender
pria tentu berbeda dengan sampel bergender wanita. Disini populasi diketahui berdistribusi
normal, dan karena sampel sedikit, dipakai uji t untuk dua sampel.
1) Input data
Sama seperti kemarin
2) Pengolahan data
Langkah-langkah :
Buka menu Analyze > Compare Means > Independent Sample T Test…. sehingga
tampak window berikut :
Pengisian:
Field data Test Variables diisi dengan variabel yang akan duji yaitu tinggi dan berat.
19 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Untuk Grouping Variabel diisi dengan variabel gender. Bagian ini perlu didefiniskan lagi dengan
meng-klik button Define Groups, sehingga tampak di layar :
Untuk Group 1 diisi dengan 1 yang berarti pria
Untuk Group 2 diisi dengan 2 yang berarti wanita
Setelah selesai tekan Continue
Klik button Option, sehingga tampak :
Pengisian :
Confidence Interval/Tingkat kepercayaan. Secara default disediakan tingkat kepercayaan
95%
Untuk Missing Values atau data yang hilang. Karena data yang ada lengkap maka biarkan
pilihan Exlude cases anaysis by analysis
Tekan Contnue untuk menyelesaikan pengisian dan OK untuk mengakhiri prosedur analisis.
3) Analisis:
Output bagian pertama
20 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Pada bagian pertama terlihat ringkasan statistic dari kedua sampel. Untuk berat badan, gender
pria (tanda 1) mempunyai berat rata-rata 66,457 kg, yang jauh di atas rata-rata berat badan
wanita yaitu 49.557 kg. Sedangkan tinggi rata-rata pria adalah 169.3 cm yang juga lebih tinggi
dari rata-rata wanita yang hanya 155.314 cm.
Output bagian kedua
1. Tinggi badan
- Analisis menggunakan F Test
Hipotesis:
H0 = Kedua varians Populasi adalah identik (varians populasi tinggi badan pria dan wanita
adalah sama)
H1 = Kedua varians Populasi adalah tidak identik (varians populasi tinggi badan
pria dan wanita adalah berbeda)
Pengambilan Keputusan:
Jika probabilitas > 0,05 , maka H0 diterima
Jika probabilitas < 0,05 , maka H0 ditolak
Keputusan:
Terlihat bahwa t hitung untuk Tinggi Badan dengan Equal Variance not assumed (diasumsi
kedua varians tidak sama atau menggunakan separate variance test) adalah 5,826 dengan
probabilitas 0,001. Oleh karena probabilitas < 0,05, maka H0 ditolak, atau kedua rata-rata
(mean) tinggi badan pria dan wanita benar-benar berbeda, dalam artian Pria mempunyai
rata-rata Tinggi badan yang lebih dari Wanita.
- Analisis dengan memakai t test untuk asumsi varians tidak sama
Hipotesis:
H0 = Kedua rata-rata populasi adalah identik (rata-rata populasi tinggi badan pria dan
wanita adalah sama)
H1 = Kedua rata-rata populasi adalah tidak identik (rata-rata populasi tinggi badan pria dan
wanita adalah berbeda)
Berbeda dengan asumsi sebelumnya yang menggunakan varians sekarang pakai means.
Pengambilan Keputusan:
Jika probabilitas > 0,05 , maka H0 diterima
Jika probabilitas < 0,05 , maka H0 ditolak
21 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Keputusan:
Terlihat bahwa untuk Tinggi Badan dengan Equal variance not assumed (diasumsikan kedua
varians tidak sama atau menggunakan separate variance test) adalah 5,826 dengan
probabilitas 0,001. Oleh karena probabilitas < 0,05, maka H0 ditolak, atau kedua rata-rata
(mean) tinggi badan pria dan wanita benar-benar berbeda, dalam artian arat-rata tinggi
badan pria lebih dari wanita
2. Berat Badan
- Analisis F test
Hipotesis:
H0 = Kedua varians Populasi adalah identik (varians populasi berat badan pria dan wanita
adalah sama)
H1 = Kedua varians Populasi adalah tidak identik (varians populasi berat badan pria dan
wanita adalah berbeda)
Pengambilan Keputusan:
Jika probabilitas > 0,05, maka H0 diterima
Jika probabilitas < 0,05, maka H1 ditolak
Keputusan:
Terlihat bahwa F hitung untuk berat badan dengan Equal variance assumed (diasumsi kedua
varians sama) adalah 4,345 dengan probabilitas 0,059. Oleh karena probabilitas > 0,05,
maka H0 diterima, atau kedua varians sama.
- Analisis memakai t test
Hipotesis:
H0 = Kedua rata-rata Populasi adalah identik (rata-rata populasi berat badan pria dan
wanita adalah sama)
H1 = Kedua rata-rata Populasi adalah tidak identik (rata-rata populasi berat badan pria dan
wanita adalah berbeda)
Pengambilan Keputusan:
Jika probabilitas > 0,05, maka H0 diterima
Jika probabilitas < 0,05, maka H0 ditolak
Keputusan:
22 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Terlihat bahwa t hitung untuk Berat Badan dengan Equal variance assumed (diasumsi kedua
varians sama) adalah 5,475 dengan probabilitas 0,037. Oleh karena probabilitas < 0,05,
maka H0 ditolak, atau kedua rata-rata (mean) berat badan pria dan wanita benar-benar
berbeda, dalam artian Pria mempunyai rata-rata Berat Badan yang lebih dari Wanita.
4. One Way Anova (Analysis Of Variance)
Uji Anova biasanya digunakan untuk pengujian lebih dari dua sampel. Berikut adalah asumsi-
asumsi yang dipakai dalam pengujian Anova :
[a] Populasi-populasi yang akan diuji berdistribusi normal
[b] Varians dari populasi-populasi tersebut adalah sama
[c] Sampel tidak berhubungan satu dengan yang lain
Kasus:
Sebuah pabrik selama ini memperkerjakan karyawan dalam 4 shift (satu shift terdiri atas
sekelompok pekerja yang berlainan). Manajer pabrik tersebut ingin mengetahui apakah ada
perbedaan produktivitas yang nyata diantara 4 kelompok kerja shift yang ada selama ini. Untuk
itu, Manajer memerintahkan seorang supervisor untuk mengamati produktivitas kerja keempat
kelompok tersebut. Berikut adalah hasilnya (angka dalam unit) :
Hari Shift
1
Shift
2
Shift
3
Shift
4
1 38 45 45 28
2 36 48 48 25
3 39 42 42 24
4 34 46 46 26
5 35 41 41 29
6 32 45 45 14
7 39 48 48 32
8 34 47 47 18
9 32 42 42 29
10 36 41 41 33
11 33 39 39 24
12 39 33 33 22
23 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Penyelesaian:
Kasus diatas terdiri dari 4 kelompok shift yang berbeda satu dengan yang lainnya atau dengan
kata lain terdiri atas 4 sampel yang bebas.
2) Memasukkan data ke SPSS
Agar dapat diuji secara Anova format tabel diatas perlu diubah menjadi format berikut :
Produk Shift Produk Shift Produk Shift Produk Shift
38 satu 45 dua 45 tiga 28 empat
36 satu 48 dua 48 tiga 25 empat
39 satu 42 dua 42 tiga 24 empat
34 satu 46 dua 46 tiga 26 empat
35 satu 41 dua 41 tiga 29 empat
32 satu 45 dua 45 tiga 14 empat
39 satu 48 dua 48 tiga 32 empat
34 satu 47 dua 47 tiga 18 empat
32 satu 42 dua 42 tiga 29 empat
36 satu 41 dua 41 tiga 33 empat
33 satu 39 dua 39 tiga 24 empat
39 satu 33 dua 33 tiga 22 empat
Langkah-langkah pembuatan variabel dan pengisian nilainya sama seperti kemarin.
3) Pengolahan Data dengan SPSS
Langkah-langkah :
Pilih menu Analyze > Compare-Means > One Way Anova… sehingga terlihat seperti
berikut :
24 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Field data Dependent List diisi dengan variabel yang akan diuji yaitu variabel produk. Klik tanda
> untuk memindahkannya.
Filed data Factor atau Group dapat diisi dengan variabel shift dengan meng-klik tanda >.
Untuk tombol Option… diklik sehingga muncul :
Pada Frame Statistic dapat dicentang checkbox Descriptive dan Homogeneity of variance test.
Dan pada Frame Missing Values biarkan pada pilihan default, karena tidak ada data yang hilang.
Tekan Continue jika selesai.
Untuk button Post-Hoc atau analisis lanjutan dari F Test, dengan meng-kliknya tampak di layar
:
Dapat dipilih Bonferroni dan Tukey. Tekan Continue jika selesai. Dan Tekan OK untuk mengakhiri
proses analisa.
4) Analisis
Output pertama
Pada bagian pertama terlihat ringkasan statistic dari keempat sampel.
25 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Output kedua (Test of Variance Homogeneity)
Analisis ini bertujuan untuk menguji berlaku tidaknya asumsi untuk ANOVA, yaitu apakah
keempat sampel mempunyai varians yang sama.
Hipotesis:
H0 = Keempat varians Populasi adalah identik
H1 = Keempat varians Populasi adalah berbeda
Pengambilan Keputusan:
Jika probabilitas > 0,05, maka H0 diterima
Jika probabilitas < 0,05, maka H0 ditolak.
Keputusan:
Terlihat bahwa Levene Test hitung adalah 1,173 dengan nilai probabilitas 0,331. Oleh karena
probabilitas > 0,05 , maka H0 diterima, atau keempat varians adalah identik.
Output bagian ketiga (ANOVA)
Setelah keempat varians terbukti sama, baru dilakukan uji Anova (Analysis of Variance) untuk
menguji apakah sampel mempunyai rata-rata (Mean) yang sama.
Hipotesis:
H0 = Keempat rata-rata Populasi adalah identik
H1 = Keempat rata-rata Populasi adalah berbeda
Berbeda dengan asumsi sebelumnya yang menggunakan varians sekarang dipakai mean.
Pengambilan Keputusan:
1. Berdasarkan perbandingan F hitung dengan F tabel :
Jika Statistic hitung (angka F output) > Statistic Tabel (tabel F), maka H0 ditolak.
Jika Statistic hitung (angka F output) < Statistic Tabel (tabel F), maka H0 diterima.
F hitung dari output adalah 44,861.
Sedang statistik tabel dapat dihitung pada tabel F yaitu 2,8164.
Keputusan:
Oleh karena F hitung terletak pada daerah H0 ditolak, maka dapat disimpulkan rata-rata
produksi keempat kelompok shift tersebut memang berbeda nyata.
2. Berdasarkan nilai probabilitas:
Jika probabilitas > 0,05, maka H0 diterima
Jika probabilitas < 0,05, maka H0 ditolak
26 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Keputusan:
Terlihat bahwa F hitung adalah 44,861 dengan probabilitas 0,000. Oleh karena probabilitas
< 0,05, maka H0 ditolak, atau rata-rata produksi keempat kelompok shift tersebut memang
berbeda nyata.
Output Bagian Keempat
Setelah diketahui bahwa ada perbedaan yang signifikan diantara keempat kelompok shift,
masalah yang akan dibahas adalah mana saja kelompok shift yang berbeda dan mana yang
tidak berbeda?. Masalah ini akan dibahas pada analisis Bonferroni dan Tukey dalam post hoc
test berikut :
Tukey test dan Bonferroni test
Sebagai contoh, lihat baris pertama pada hasil uji Tukey-HSD yang menguji perbedaan
antara shift 1 dan shift 2.
Pada kolom Mean Difference atau perbedaan rata-rata diperoleh angka -7,5. Angka ini
berasal dari Mean shift 1 – Mean shift 2 atau 35,58 – 43,08 unit atau -7,5 unit
Pada kolom 95% confidence interval, terlihat range perbedaan Mean tersebut berkisar
antara -2,76 sampai -12,24 unit.
Uji signifikansi perbedaan Mean antara shift 1 dan shift 2:
Berdasarkan nilai probabilitas:
Jika probabilitas > 0,05, maka H0 diterima
Jika probabilitas < 0,05, maka H0 ditolak
Keputusan:
Terlihat bahwa nilai probabilitas adalah 0,001. Oleh karena probabilitas < 0,05, maka H0
ditolak, atau perbedaan rata-rata produktivitas shift 1 dan shift 2 benar-benar nyata.
Hasil uji signifikansi dengan mudah dapat dilihat pada output dengan ada atau tidaknya
tanda ‘*’ pada kolom ‘Mean Difference’. Jika tanda * ada angka Mean Difference atau
perbedaan Rata-rata, maka perbedaan tersebut nyata atau signifikan. Jika tidak ada tanda
*, maka perbedaan tidak signifikan.
Dari pertama terlihat adanya tanda pada angka -7,5, yang menandakan perbedaan tersebut
benar-benar nyata.
Demikian untuk hubungan antar variabel yang lain, missal antara shift 1 dengan shift 3, shift
4 dengan shift 3 dan lainnya.
27 | B a h a n A j a r P a k e t P r o g r a m S P S S I n f e r e n s i a S t a t i s t i k
Dengan melihat ada tidaknya tanda * pada kolom Mean Difference, terlihat bahwa:
Mean dari shift 1 berbeda secara nyata dengan shift 2, 3 dan 4
Mean dari shift 2 berbeda secara nyata dengan shift 4
Mean dari shift 3 berbeda secara nyata dengan shift 4
Mean dari shift 4 berbeda secara nyata dengan shift 1, 2 dan 3
Referensi
Harinaldi. 2005. Prinsip-Prinsip Statistik Untuk Teknik dan Sains, Erlangga, Jakarta.
Kerlinger, F.N. (1986) Foundations of Behavioral Research. 3rd Edition, Holt, Rinehart and
Winston, New York.
Nisfiannoor, Muhammad. (2009). Pendekatan Statistika Modern Untuk Ilmu Sosial. Jakarta:
Salemba Humanika
Singgih Santoso. SPSS Versi 10. Pengolah Statistik Para Profesional. Elex Media Komputindo.