Analisis Survival

PENDAHULUAN

Regresi linear memainkan peranan penting dalam statistik. Dalam analisis survival, waktu kegagalan dipercepat (AFT) model berfungsi sebagai mitra dari model regresi linier klasik dengan transformasi monoton dari waktu acara T, katakanlah Y = log T, lebih dari kovariat Z, yaitu, Y = ZTb + , (1)

di mana b adalah vektor tidak diketahui koefisien regresi dan menunjukkan istilah kesalahan. Prosedur inferensi untuk AFT Model (lihat, misalnya, Buckley dan James 1979; Prentice 1978; Louis 1981; Wei dan Gail 1983; Tsiatis 1990; Ritov 1990; Wei, Ying,
dan Lin 1990) telah diturunkan tanpa menentukan distribusi dari
, tetapi umumnya memerlukan jangka kesalahan untuk memiliki independen Z umum distribusi. Asumsi ini menghalangi data heteroscedasticity dan memerlukan efek lokasi-pergeseran untuk setiap kovariat. Kesimpulan bias dapat dicapai bila efek konstan tersebut tidak memadai untuk semua kovariat. Sebagai contoh, dalam sebuah studi dialisis ginjal terakhir (Kutner, Clow, Zhang, dan Avilés 2002), peneliti ​​tertarik mempelajari efek dari sindrom kaki gelisah (RLS) pada kematian
pada pasien yang menjalani dialisis. Meskipun sangat disarankan oleh analisis sementara, hubungan antara gejala RLS dan risiko kematian tidak didukung oleh pemeriksaan data akhir ditetapkan berdasarkan pada model AFT (p = 0.23). Investigasi lainnya disajikan dalam Bab 5, mengungkapkan bahwa keparahan gejala RLS mungkin memiliki kekuatan yang berbeda prognostik untuk mortalitas di seluruh pasien pada tahap hidup yang berbeda. Mengabaikan perubahan pola efek RLS dalam analisis AFT tampaknya gagal untuk menangkap asosiasi RLS mortalitas yang kuat dalam survivor dialysis jangka pendek.


Regresi Quantile (Koenker dan Bassett 1978) telah muncul sebagai perpanjangan signifikan dari regresi linier klasik dengan menggunakan konsep quantiles bersyarat. Diberikan
vektor kovariat Z = (1, ZT)T dengan ordo p x 1 dan τ
[0, 1], tanpa menghilangkan general quantiles bersyarat dari variabel acak, katakanlah Y , didefinisikan sebagai

QY (τ | Z) = inf {t: Pr (Y ≤ t | Z) ≥ τ}.

Sebuah model regresi linear kuantil dapat membuat hubungan QY (τ | Z) sampai Z untuk masing-masing 0 <τ <1, yaitu,

QY (τ | Z) = ZTβ (τ), τ (0, 1), (2)

di mana (τ) adalah vektor koefisien regresi β tidak diketahui, mewakili efek kovariat pada t quantile dari Y dan dapat berubah dengan τ. Sangat mudah untuk melihat bahwa model (2) tereduksi menjadi model AFT (1) ketika β (τ) = {Q (τ), bT}T,

di mana Q (τ) menunjukkan persentil ke t. Dibandingkan dengan model AFT, model regresi quantile (2) lebih fleksibel dalam dimana efek dari Z tidak terbatas dan konstan di τ. Formulasi efek varian ini telah berguna dalam situasi praktis, seperti dalam contoh dialisis.
Tapi dengan data survival, inferensi untuk regresi quantile
umumnya rumit dalam penyensoran. Penelitian Powell (1984, 1986) telah menghasilkan ide deviasi paling mutlak (LAD) dalam regresi quantile tradisional untuk menangani pengamatan yang disensor. Tetapi pendekatan ini memerlukan waktu menyensor (C) yang harus diamati. Waktu sensor tidak selalu diamati dalam kebanyakan pengaturan survival. Seperti Skenario utama dalam investigasi kami diartikel ini. Dengan informasi yang tidak lengkap pada waktu sensor, ada banyak metode regresi quantile yang mengupayakan pengurangan kompleksitas untuk memulihkan informasi quantile yang hilang dengan mengadopsi mekanisme penyensoran yang kuat atau memaksakan sebuah pendekatan homoskedastisitas. Sebagai contoh, dengan asumsi bahwa menyensor waktu penyensoran (C) adalah independen dengan Z, Ying, Jung, dan Wei (1995) mengusulkan sebuah prosedur untuk regresi semiparametrik median. Persamaan estimasi yang diadopsi secara konsep sederhana namun tidak monoton atau terus menerus. Sebagai hasilnya, implementasi metode penulis ini mungkin memerlukan usaha komputasi yang intensif. Di bawah asumsi penyensor independen biasa (yaitu, T dan C adalah independen bersyarat pada Z), Yang (1999) menganggap estimasi sebuah model regresi median yang didasarkan pada empiris tertimbang
survival dan fungsi hazard.
Pendekatan ini membutuhkan iid error atau distribusi error yang konvergen terhadap tingkat tertentu. Generalisasi metode ini untuk kasus heteroskedastisitas yang lebih umum kelihatannya sulit. Tanpa memaksakan asumsi penyensoran yang independen, tidak bersyarat dan kuat atau kendala pada distribusi kesalahan, Portnoy (2003) novelly mengadopsi prinsip selfconsistency untuk estimasi Kaplan-Meier (Efron 1967)\ dan mengembangkan prosedur estimasi rekursif tertimbang. Para algoritma dari Portnoy (2003) mengurangi estimator Kaplan-Meier (1958) dalam kasus satu sampel, namun algoritma rekursif jauh mempersulit argumen estimasi dan kesimpulan. Portnoy (2003) menguraikan algoritmik komplikasi dan membahas masalah komputasi yang terkait dengan bootstrap berdasarkan prosedur inferensial (lihat, Portnoy 2003, app. B bagian 6.1). Sifat asimtotik baru-baru ini didirikan untuk algoritma erat-terkait "grid" (Neocleous, Vanden Branden, dan Portnoy 2006), tetapi tidak untuk algoritma rekursif asli tertimbang. Untuk yang terbaik dari pengetahuan kita, perlakuan sampel besar dalam regresi kuantil yang ditaksir sebagai proses τ tetap tidak sempurna dipahami. Ini mungkin menghambat eksplorasi lebih lanjut dari sifat variasi quantile efek, seperti dalam contoh dialisis sebelumnya, serta dalam banyak studi ilmiah lainnya.

Pada artikel ini kita mengembangkan metode regresi kuantil baru untuk subjek data survival pada penyensoran independen bersyarat. Tujuan kami menggunakan fitur martingale yang terkait dengan data yang tersensor, yang sangat memudahkan baik studi-studi sampel besar
dan prosedur inferensial. Pertama, disarankan ungtuk mengestimasi persamaan yang memiliki properti monotonisitas yang bagus. Sebagai hasilnya, kami mampu mengembangkan algoritma sederhana yang hanya melibatkan urutan minimizations fungsi cembung tipe L1. Prosedur estimasi baru dapat dengan mudah dan terpercaya diimplementasikan dengan mengadaptasi fungsi-fungsi yang ada di R dan S-PLUS. Dibandingkan dengan pendekatan dari Portnoy (2003) dan Neocleous dkk. (2006), prosedur yang diusulkan lebih baik didefinisikan, memiliki lebih sedikit, jika ada, komplikasi algoritmik. Kedua, dengan menggunakan proses empiris dan teknik stokastik yang terpisah, kita membangun properti asimtotik , termasuk konsistensi yang seragam dan konvergensi yang lemah, untuk estimasi regresi kuantil. Selain itu, kami
memberikan bentuk tertutup untuk proses batas sampel regresi quantiles. Salah satu penggunaan tertentu dari hasil ini adalah untuk menyelidiki efisiensi estimator kita, paling mudah dalam sampel K- kasus. Ketiga, kita mengembangkan baik dibenarkan sampling ulang berbasis prosedur inferensi yang dapat digunakan untuk memperkirakan varians dari
estimator yang diusulkan, serta untuk memberikan ringkasan yang bermanfaat atau pengujian alat untuk proses regresi quantile yang mendasarinya. Metode sampling ulang memperpanjang teknik Jin, Ying, dan Wei (2001) untuk pengaturan dengan estimator fungsional. Seperti prosedur estimasi baru, kesimpulan sampling ulang yang diusulkan selalu didefinisikan dengan jelas. Sisa dari artikel ini disusun sebagai berikut. Pada Bagian 2 pertama memberikan prosedur estimasi regresi untuk model quantiles bawah (2). Dalam kasus satu sampel, kami mengestimasi hubunganan erat dengan Nelson-Aalen estimator (Nelson 1972;Aalen 1978). Kami membangun konsistensi yang seragam dan konvergensi yang lemah dari proses regresi quantile yang diperkirakan pada Bagian 3. Prosedur inferensi berbasis sampling ulang, termasuk pengujian hipotesis, tahap kedua inferensi pada efek variasi covariate, dan diagnostik model, dalam Bagian 4. dalam Bagian 5 kami melaporkan hasil dari simulasi Monte-Carlo yangmenilai kinerja empiris dari metode yang diusulkan. Kami juga menggambarkan kegunaan praktis dari metode yang diusulkanmelalui analisis dari studi dialisis ginjal yang dijelaskan sebelumnya. Kami menyimpulkan dengan beberapa komentar terakhir dalam Bagian 6.

0 komentar:

Posting Komentar

Total Tayangan Halaman

Pengikut

About Me

Diberdayakan oleh Blogger.

Copyright © / Statistiku

Template by : Urang-kurai / powered by :blogger