Uji Linearitas dengan SPSS: Scatter Plot dan Lack-of-fit Test

Dalam analisis regresi linear, terdapat asumsi-asumsi yang perlu kamu penuhi untuk menghasilkan hasil analisis yang valid. Salah satu asumsi tersebut adalah linearitas. Asumsi linearitas yang tidak terpenuhi akan memengaruhi hasil analisismu, sehingga kurang tepat jika nantinya digunakan untuk kepentingan proyeksi di waktu yang akan datang.

Untuk memeriksa asumsi linearitas, kamu perlu melakukan uji linearitas. Apa sih uji linearitas itu? Mengapa penting dilakukan dalam regresi linear? Bagaimana cara melakukan uji linearitas? Yuk simak artikel ini sobat tambahpinter!

Pengertian Uji Linearitas

Secara sederhana, uji linearitas adalah pengujian untuk memeriksa apakah terdapat hubungan yang linear antara variabel independen dengan variabel dependen. Uji linearitas dimaksudkan untuk menguji linear atau tidaknya data yang dianalisis (Sudjana, 2003).  Linearitas merupakan asumsi yang penting dalam penggunaan regresi linear. Beberapa peneliti berpendapat bahwa asumsi ini adalah yang paling penting karena secara langsung berkaitan dengan bias dari hasil keseluruhan analisis (Keith, 2006).

Definisi Linieritas
Sumber: www.ims.navajo-nsn.gov

Linearitas mendefinisikan variabel dependen (respon) sebagai fungsi linear dari variabel independen (prediktor) (Darlington, 1968). Artinya, perubahan nilai di salah satu variabel independen akan menghasilkan perubahan yang konstan pada variabel dependen. Linearitas juga merupakan karakteristik dari parameter model (Krzanowski, 1998). Adanya perubahan pada parameter akan mengarah ke perubahan yang sama dalam variabel dependen.

Baca juga: Cara Lengkap Uji Autokorelasi

Fungsi Uji Linearitas

Tidak terpenuhinya asumsi linearitas dalam regresi linear akan menyebabkan estimasi parameter regresi menjadi bias, termasuk koefisien regresi, standard error, dan pengujian signifikansi statistik. Metode regresi linear menjadi kurang tepat jika kamu mengaplikasikannya pada data yang ternyata memiliki pola non-linear. Parameter regresi linear akan selalu dapat dihitung, meskipun terdapat asumsi yang tidak terpenuhi. Namun hal inilah yang berakibat pada biasnya estimasi parameter dari regresi.

Jika keterkaitan antara variabel dependen dan independen tidak linier, maka akan diperoleh hasil analisis regresi yang underfitting atau overfitting. Selain itu, risiko kesalahan Tipe I dan Tipe II juga akan meningkat. Disinilah pentingnya. Selain memastikan adanya hubungan yang linear antara variabel independen dengan dependen, uji linearitas juga berfungsi untuk menghindari hasil analisis yang bias dan tidak valid.

Cara Uji Linieritas

Untuk melakukan uji linearitas, terdapat dua cara yang dapat kamu gunakan. Pertama, melalui penilaian secara visual melalui scatter plot. Cara yang kedua adalah melakukan uji linearitas secara kuantitatif, yakni menggunakan statistical test yang bernama lack-of-fit test.

Scatter Plot

Secara visual, uji linearitas dapat dilakukan melalui penggunaan scatter plot yang menggambarkan hubungan antara variabel dependen dengan independen (Casson & Farmer, 2014). Istilah scatter plot sama dengan penerapan grafik biasa, yakni variabel independen diletakkan pada sumbu X, sedangkan variabel dependen berada pada sumbu Y. Namun yang membedakan adalah scatter plot hanya berupa sebaran titik-titik observasi, bukan berupa garis yang dihubungkan pada setiap titik observasi.

Scatter Plot
Sumber: mathbootcamps.com

Hubungan linear antara variabel dependen dengan independen dapat dikategorikan menjadi dua jenis, yakni positif dan negatif. Hubungan linier yang positif berarti bahwa semakin besar nilai variabel independen, semakin besar pula nilai variabel dependen. Hal sebaliknya berlaku pula untuk hubungan linear yang negatif.

Namun penggunaan scatter plot antara variabel dependen vs independen tidaklah efektif apabila terdapat banyak variabel independen yang digunakan dalam regresi linear karena perlu memperhatikan banyak scatter plot secara satu-per-satu. Terdapat cara visual lain yang dapat digunakan untuk melakukan uji linearitas, yakni melalui scatter plot antara studentized residual model regresi linear dengan nilai prediksi variabel dependen (Yfitted) (Stevens, 2009).

Scatter Plot
Sumber: Osborne & Waters, 2002

Kedua gambar di atas mengilustrasikan scatter plot antara studentized residual dengan Yfitted. Pada gambar di bagian kiri, ilustrasi tersebut mengindikasikan bahwa asumsi linearitas telah terpenuhi karena titik-titik observasi tersebar merata di sekitar garis horizontal dan tidak membentuk pola tertentu. Sedangkan ilustrasi gambar pada bagian kanan menandakan tidak terpenuhinya asumsi linearitas. Hal tersebut disebabkan titik-titik observasi membentuk pola tertentu dan persebarannya tidak berada di sekitar garis horizontal.

Namun bagaimana cara membuat scatter plot antara studentized residual dengan Yfitted secara manual? Untuk membuat scatter plot tersebut, kamu dapat mengikuti langkah-langkah di bawah ini:

  1. Melakukan pemodelan regresi linear antara variabel dependen dengan independen. Misalkan terdapat data mengenai banyaknya HP yang diservis (variabel independen = X) dan lamanya waktu servis HP (variabel dependen = Y) yang ditampilkan pada tabel di bawah ini.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  2. Menghitung Yfitted berdasarkan persamaan regresi linear pada langkah 1 dengan cara melakukan substitusi nilai variabel independen ke dalam persamaan tersebut. Diketahui hasil persamaan regresi pada contoh soal di atas adalah: Y = -2,3221 + 14,7383 X. Setelah diperoleh hasil Yfitted, selanjutnya kamu dapat menghitung residual dengan cara melakukan operasi pengurangan antara nilai aktual Y dengan Yfitted. Hasilnya adalah sebagai berikut.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  3. Menghitung studentized residual menggunakan rumus:
    Scatter Plot
    Sumber: Dokumentasi Penulis

    Perhitungan unsur penyebut pada rumus di atas cukup rumit apabila dilakukan secara manual. Sehingga untuk mempermudahnya, studentized residual dihitung dengan memanfaatkan software statistik, yaitu SPSS dan akan dibahas pada pembahasan selanjutnya. Di bawah ini merupakan hasil dari studentized residual untuk contoh soal di atas.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  4. Membuat scatter plot antara studentized residual (sumbu Y) dengan Yfitted (sumbu X), serta garis horizontal pada Y = 0.
    Scatter Plot
    Sumber: Dokumentasi Penulis

    Melalui scatter plot di atas, kamu dapat melakukannya untuk menilai apakah asumsi linearitas pada persoalan sebelumnya telah terpenuhi. Secara visual, persebaran titik-titik observasi telah cukup tersebar di sekitar garis horizontal dan juga tidak membentuk pola tertentu. Sehingga dapat dikatakan bahwa secara visual, asumsi linearitas telah terpenuhi.

Baca juga: Uji Validitas SPSS

Lack-of-fit Test

Pengujian linearitas dengan menggunakan scatter plot masih memungkinkan timbulnya hasil yang rancu karena adanya subjektivitas ketika menilai persebaran dan pola dari titik-titik observasi. Untuk mengantisipasi permasalahan tersebut, terdapat metode kuantitatif yang dapat digunakan untuk uji linearitas, yakni lack-of-fit test. Langkah-langkah dan rumus uji linearitas dengan menggunakan lack-of-fit test terhadap contoh soal sebelumnya adalah sebagai berikut:

  • Hipotesis:
    H0: Terdapat hubungan linear antara variabel dependen dengan independen
    H1: Tidak terdapat hubungan linear antara variabel dependen dengan independen
  • Statistik uji:
    Rumus lack-of-fit test untuk uji linearitas adalah,

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis

    Simbol c merupakan banyaknya nilai unik (distinct value) pada variabel independen, p adalah banyaknya parameter dalam model regresi linier, sedangkan n adalah banyaknya observasi. Dalam contoh soal sebelumnya, banyaknya variabel independen adalah 1, sehingga p = banyaknya variabel independen + 1 = 2. Di bawah ini merupakan simulasi perhitungan nilai F untuk lack-of-fit-test.
    1. Melakukan pemodelan regresi linear antara variabel dependen (lamanya waktu servis HP) dengan independen (banyaknya HP yang diservis). Diketahui hasil persamaan regresinya adalah: Y = -2,3221 + 14,7383 X. Kemudian lakukan operasi substitusi antara variabel independen ke dalam persamaan tersebut, sehingga diperoleh nilai estimasi lamanya waktu servis HP (Yfitted).

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis

    2. Mengurutkan nilai variabel independen dari yang terendah hingga tertinggi. Selanjutnya kelompokkan nilai-nilai variabel independen (X) yang sama, kemudian hitung rata-rata dari nilai variabel dependen (Y) dan nilai Yfitted berdasarkan kelompok-kelompok nilai variabel dependen.

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis

    Nilai c dapat ditandai dari banyaknya warna yang berbeda pada variabel dependen (X), sehingga c = 8. Dengan mensubstitusikan simulasi perhitungan di atas pada rumus lack-of-fit test, maka nantinya diperoleh nilai F.

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis
  • Daerah penolakan:
    Tolak H0 jika,

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis

    Nilai alpha (taraf signifikan) yang digunakan dalam pembahasan ini adalah 5%. Untuk membandingkan nilai Fhitung dengan Fstatistik, kamu perlu mengetahui nilai Fstatistik melalui Tabel Distribusi F. Di bawah ini merupakan Tabel Distribusi F untuk alpha = 5%.

    Lack-of-fit Test
    Sumber: Regression Analysis by Example 5th ed. – Samprit Chatterjee & Ali S. Hadi

    Untuk mendapatkan nilai Fstatistik, kamu perlu menentukan nilai n1 dan n2. Pada lack-of-fit test ini, n1 = c – p = 6. Adapun n2 = n – c = 18 – 8 = 10. Dengan demikian nilai Fstatistik yang kamu dapatkan adalah 3,22.

  • Keputusan:
    Oleh karena nilai Fhitung < Fstatistik, maka keputusan yang diambil adalah gagal tolak H0.
  • Kesimpulan:
    Berdasarkan hasil uji linearitas menggunakan lack-of-fit test, dapat disimpulkan bahwa terdapat hubungan linear antara banyaknya HP yang diservis dengan lamanya waktu servis HP. Hasil dari lack-of-fit test ini memperkuat hasil uji linearitas ketika menggunakan scatter plot yang ada pada pembahasan sebelumnya.

Baca juga: Cara Melakukan Uji Reliabilitas

Uji Linearitas SPSS

SPSS merupakan software yang sering digunakan untuk kepentingan analisis statistik. Banyak hal yang dapat kamu lakukan pada software ini, salah satunya adalah uji linearitas. Pada pembahasan kali ini, uji linearitas pada regresi linier akan menggunakan SPSS versi 22 terhadap data mengenai 25 nilai ujian akhir siswa (Y) yang diduga dipengaruhi oleh tiga nilai kuis terdahulu (X1, X2, dan X3).

Uji Linieritas menggunakan SPSS 22
Sumber: Dokumentasi Penulis

Sebelum memulai uji linearitas dengan SPSS, terlebih dahulu kamu perlu mendefinisikan nama dan format variabel pada “Variable View” yang terletak di bagian bawah SPSS. Sehingga selanjutnya kamu dapat meng-input data tersebut pada “Data View”.

Uji Linieritas menggunakan SPSS 22
Sumber: Dokumentasi Penulis

Setelah data ter-input, kamu dapat mulai melakukan uji linearitas terhadap persoalan tersebut pada SPSS. Teknik pertama yang akan digunakan adalah secara visual, yakni membuat scatter plot antara Yfitted vs studentized residual. Kemudian teknik kedua adalah secara statistical test, yakni dengan menggunakan lack-of-fit test.

Scatter Plot

Langkah-langkah membuat scatter plot antara Yfitted vs studentized residual untuk uji linearitas pada SPSS 22 adalah sebagai berikut:

  1. Dapatkan nilai Yfitted dan studentized residual dengan cara memilih menu Analyze > Regression > Linear.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  2. Pada kolom “Dependent”, isi variabel Y. Adapun kolom “Independent(s)” diisi oleh variabel X1, X2, dan X3. Kemudian klik “Save”.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  3. Pada window baru yang muncul, centanglah “Unstandardized” pada Predicted Values dan “Studentized” pada Residuals. Selanjutnya klik “Continue” dan diakhiri dengan klik “OK”.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  4. Hasil dari langkah nomor 3 adalah munculnya variabel baru pada Data View bernama “PRE_1”, yakni Yfitted, dan “SRE_1” yang tidak lain adalah studentized residual.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  5. Membuat scatter plot antara PRE_1 vs SRE_1 dengan memilih menu Graphs > Legacy Dialogs > Scatter/Dot, kemudian pilih Simple Scatter dan klik “Define”.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  6. Masukkan Studentized Residual (SRE_1) pada kolom “Y Axis”, Unstandardized Predicted Value (PRE_1) pada kolom “X Axis”, lalu klik “OK” untuk mengakhiri.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  7. Selanjutnya akan muncul output berupa gambar scatter plot seperti di bawah ini.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  8. Pada langkah nomor 7, belum terdapat garis horizontal pada Y = 0 yang dapat digunakan untuk mempermudah dalam penentuan persebaran dan pola titik-titik observasi. Untuk menambahkan garis horizontal tersebut, kamu perlu melakukan klik sebanyak 2 kali tepat pada gambar scatter plot, sehingga nantinya akan muncul window baru. Isi angka 0 pada “Position” yang berarti bahwa akan dibuat garis horizontal pada Y = 0, kemudian akhiri dengan klik “Apply”.

    Scatter Plot
    Sumber: Dokumentasi Penulis
  9. Hasil akhir dari modifikasi scatter plot tersebut adalah munculnya garis horizontal pada Y = 0.
    Scatter Plot
    Sumber: Dokumentasi Penulis

    Melalui scatter plot di atas, secara visual terlihat bahwa terdapat beberapa titik yang berada jauh dari garis horizontal dan juga titik observasi lainnya. Hal ini menjadi indikasi bahwa tidak terpenuhinya asumsi linearitas pada kasus yang dianalisis.

Lack-of-fit Test

Setelah menggunakan metode visual, selanjutnya adalah melakukan uji linearitas dengan metode lack-of-fit test untuk menghasilkan kesimpulan yang lebih pasti, yakni tanpa adanya unsur subjetivitas. Berikut ini langkah-langkah menggunakan lack-of-fit test pada SPSS 22:

  1. Untuk memulai uji linearitas, pilih menu Analyze > Compare Means > Means. Nantinya akan muncul sebuah window baru.

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis
  2. Isi kolom “Dependent List” dengan variabel Y, kemudian kolom “Independent List” dengan variabel X1, X2, dan X3. Selanjutnya klik “Options”.

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis
  3. Beri tanda centang pada “Test for linearity” ketika muncul window baru. Klik “Continue”, selanjutnya klik pula “OK”.

    Lack-of-fit Test
    Sumber: Dokumentasi Penulis
  4. Setelah seluruh langkah-langkah tersebut dilakukan, nantinya akan muncul beberapa output pada SPSS Statistics Viewer. Hasil dari pengujian linearitas ini berada pada tabel yang terpisah, yakni antara Y*X1, Y*X2, dan Y*X3. Output tabel yang perlu kamu perhatikan hanyalah ANOVA Table.
    Lack-of-fit Test
    Sumber: Dokumentasi Penulis

    Untuk menguji linearitas antara setiap variabel independen terhadap variabel dependen, kamu cukup memperhatikan nilai Sig (p-value) pada bagian Deviation from Linearity. Nilai F pada Deviation from Linearity ini dapat kamu peroleh dengan cara menerapkan rumus pada lack-oft-test.

    Dengan menggunakan hipotesis H0: Terdapat hubungan linear antara variabel dependen dengan independen vs H1: Tidak terdapat hubungan linear antara variabel dependen dengan independen dan taraf signifikan (alpha) sebesar 5%, daerah penolakannya adalah tolak H0 jika p-value < alpha.

    Ketiga nilai p-value pada Anova Table di atas lebih tinggi dibandingkan alpha, sehingga keputusannya adalah gagal tolak H0. Oleh karena itu dapat disimpulkan bahwa setiap nilai kuis pada 25 siswa memiliki hubungan yang linear terhadap nilai ujian akhir. Dengan kata lain, uji linearitas pada persoalan ini telah terpenuhi.

    Adanya perbedaan hasil antara pengujian linearitas ketika menggunakan scatter plot dan lack-of-fit test, sebaiknya kamu memilih hasil uji linearitas pada lack-of-fit test. Hal ini dikarenakan metode lack-of-fit test berdasarkan pada perhitungan kuantitatif dan terhindar dari unsur subjetivitas.

Bagaimana Jika Uji Linearitas Tidak Terpenuhi?

Seperti yang telah kamu ketahui pada pembahasan sebelumnya, akibat dari uji linearitas yang tidak terpenuhi adalah hasil estimasi parameter regresi linear menjadi bias. Jika hasil uji linearitas tidak terpenuhi, yakni mengarah pada kesimpulan tidak terdapat hubungan linear antara variabel independen dengan dependen, kamu perlu mengambil tindakan untuk mengatasinya.

Cara paling sederhana untuk mengatasi uji linearitas yang tidak terpenuhi adalah melakukan transformasi terhadap data yang kamu gunakan. Dengan melakukan transformasi, beberapa pola nonlinear sederhana dapat dibuat menjadi linear. Di bawah ini merupakan tabel beberapa cara transformasi yang dapat kamu gunakan berdasarkan bentuk nonlinearnya.

Bagaimana Jika Asumsi Linieritas Tidak Terpenuhi?
Sumber: Regression Analysis by Example 5th ed. – Samprit Chatterjee & Ali S. Hadi

Selain transformasi variabel, kamu dapat beralih ke metode selain regresi linear untuk mengatasi uji linearitas yang tidak terpenuhi. Beberapa metode yang mempertimbangkan unsur non-linearitas adalah Regresi Polinomial dan Regresi Piecewise. Kedua metode ini dapat dikatakan sebagai tindakan penyesuaian atau manipulasi terhadap variabel independen dengan cara mentrasnformasi variabel independen sedemikian rupa sehingga hubungan antara variabel independen yang telah ditransformasi mengikuti pola dalam data (Best & Wolf, 2015).

Baca juga: Uji Normalitas SPSS

Pemahaman Akhir

Dalam analisis regresi linear, terdapat asumsi-asumsi yang harus dipenuhi untuk menghasilkan hasil analisis yang valid. Salah satu asumsi penting adalah linearitas. Jika asumsi linearitas tidak terpenuhi, hasil analisis dapat menjadi tidak tepat dan tidak valid jika digunakan untuk proyeksi di masa depan.

Uji linearitas adalah pengujian untuk memeriksa apakah terdapat hubungan yang linear antara variabel independen dengan variabel dependen. Uji ini penting dalam regresi linear karena asumsi linearitas yang tidak terpenuhi dapat menyebabkan estimasi parameter regresi menjadi bias, termasuk koefisien regresi, standard error, dan pengujian signifikansi statistik. Selain itu, kesalahan Tipe I dan Tipe II juga dapat meningkat, serta analisis regresi dapat menghasilkan hasil yang underfitting atau overfitting.

Ada dua cara untuk melakukan uji linearitas. Pertama, secara visual melalui scatter plot yang menggambarkan hubungan antara variabel dependen dengan independen. Scatter plot dapat membantu melihat apakah terdapat pola linear atau tidak. Kedua, secara kuantitatif dengan menggunakan statistical test yang disebut lack-of-fit test. Lack-of-fit test dapat memberikan kesimpulan yang lebih objektif tanpa adanya unsur subjektivitas.

Jika uji linearitas tidak terpenuhi, ada beberapa langkah yang dapat diambil. Salah satunya adalah melakukan transformasi terhadap data agar pola non-linear menjadi linear. Selain itu, metode alternatif seperti Regresi Polinomial atau Regresi Piecewise juga dapat dipertimbangkan.

Penting untuk memastikan asumsi linearitas terpenuhi sebelum menggunakan hasil analisis regresi linear untuk kepentingan proyeksi atau prediksi di masa depan. Dengan memahami dan menguji linearitas, analisis regresi linear dapat menjadi lebih valid dan akurat.

Nah sekian pembahasan artikel ini mengenai uji linearitas. Kamu dapat membaca referensi-referensi pendukung lainnya atau berdiskusi dengan rekan dan dosen untuk menambah informasi lebih dalam.


Sumber:

Sudjana. (2003). Teknik Analisis Regresi dan Korelasi bagi Peneliti. Bandung: Tarsito.

Keith, T. (2006). Multiple regression and beyond. PEARSON Allyn & Bacon.

Osborne, J., & Waters, E. (2002). Four assumptions of multiple regression that researchers
should always test.
Practical Assessment, Research & Evaluation, 8(2).

Darlington, R. (1968). Multiple regression in psychological research and practice. Psychological Bulletin, 69(3), 161-182.

Krzanowski, W. J. (1998). An introduction to statistical modelling. London: Arnold.

Casson, R. J., & Farmer, L. D. (2014). Understanding and checking the assumptions of linear regression: a primer for medical researchers. Clinical and Experimental Ophthalmology, 42, 6, 590-596.

Stevens, J. P. (2009). Applied multivariate statistics for the social sciences (5th ed.). New York, NY: Routledge.

Best, H., & Wolf, C. (2015). The SAGE handbook of regression analysis and causal inference. Los Angeles: SAGE Publications Ltd.

Artikel Terbaru

Avatar photo

Puput

Hi! I'm Puput and I have graduated from Statistics - Institut Teknologi Sepuluh Nopember (ITS). I'm interested in data analytics/science, machine learning, statistical quality control, and proofreading.

Komentar

Tulis Komentar Anda

Your email address will not be published. Required fields are marked *