Saya telah membaca makalah tentang pembelajaran kurikulum untuk LLM sekitar 3 tahun yang lalu. Menggunakan beberapa fitur/reduksi pada gradien untuk mengurutkan korpus teks, yang mempercepat konvergensi. Semoga saya bisa ingat makalahnya.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
16 Suka
Hadiah
16
6
Bagikan
Komentar
0/400
TokenAlchemist
· 08-01 21:21
sejujurnya pemesanan gradien hanyalah copium... pengaturan optimal adalah tempat alpha yang sesungguhnya.
Lihat AsliBalas0
LucidSleepwalker
· 07-30 05:26
Sekali lagi kertas yang tidak bisa diingat...
Lihat AsliBalas0
StablecoinAnxiety
· 07-30 05:20
Kode lama tiga tahun yang lalu, di mana mencarinya?
Lihat AsliBalas0
DiamondHands
· 07-30 05:09
Para penulis makalah juga memiliki momen kehilangan ingatan.
Saya telah membaca makalah tentang pembelajaran kurikulum untuk LLM sekitar 3 tahun yang lalu. Menggunakan beberapa fitur/reduksi pada gradien untuk mengurutkan korpus teks, yang mempercepat konvergensi. Semoga saya bisa ingat makalahnya.