Ada riset terbaru dari Meta AI, yaitu Long Llama. Basically ini model Llama 2 yg di upgrade untuk handle long context (up to 32k tokens). How? 1. Continue pretraining Llama 2 di training ulang dengan additional data dimana data baru ini punya konteks yg lebih panjang. 2. Instruction tuning So far
Yo Gan, ada model LLM baru yg katanya better daripada Llama 2, namanya Mistral. And nih model udah rilis juga di Hugging Face https://S E N S O R/mistralai/Mistral-7B-v0.1 https://S E N S O R/mistralai/Mistral-7B-Instruct-v0.1 Apakah agan2 ada yg udah coba? So far performance-nya gimana, khu
Buat agan2 yang lagi coba fine tuning Llama 2 pakai Hugging Face namun hasil jawabannya selalu repetitif, ternyata di tokenizer-nya Hugging Face ada problem seperti yg di discuss di Githubnya (https://github.com/huggingface/transformers/issues/22794) Basically, kalo pake AutoTokenizer, dia bakal pa
Google bakalan ngerilis IDE cloud-based untuk ngoding aplikasi full-stack, namanya Project IDX. Overall ini mirip2 dengan Google Colab sih, tapi ini untuk app development. Nah, yang paling ane suka itu fitur AI-nya dimana interface-nya itu chat based dan dia bisa ngerti konteks code, file, dan di...
Gan, barangkali ada rekomendasi series di Disney Hotstar atau HBO GO yang bagus boleh dong share dimari, ane terbuka untuk semua genre
Halo gan Ane butuh rekomendasi tempat sewa GPU buat training model ML, agan2 dimari biasanya pakai apa ya? Ane selama ini masih nyobain JarvisLab dan Google Colab Pro, barangkali agan2 dimari ada yang pernah eksplor tempat lain, boleh nih di share
Polusi dan kualitas udara di Jakarta dan sekitarnya belakangan ini bikin banyak orang sakit, loh! Enggak cuma masalah pernapasan aja, tapi dokter bilang udara yang buruk juga bisa bikin masalah jantung, nih! Dokter spesialis paru dari RSUP Persahabatan, Erlina Burhan, ceritain kalau udara yang kita
Halo gan, ane mau sharing soal beberapa tempat yang oke untuk belajar machine learning menurut ane. Articles 1. Hugging Face Blog 2. Tensorflow Blog 3. Jay Alammar's Blog 4. Aman.ai Youtube 1. Sentdex 2. Yannic Kilcher 3. Chris Alexiux 4. Code Your Own AI 5. Code Emporium 6. Computer Phile 7. Nich
Berikut ini beberapa tempat penyedia dataset yang bisa agan gunakan untuk project machine learning. 1. Kaggle 2. Tensorflow Datasets 3. Hugging Face 4. Data Govs 5. Open ML Kalau ada preferensi lain, silahkan tambahkan di kolom komentar gan.
LoRA ini salah satu metode yang menurut ane keren sih, gimana enggak? dengan LoRA ini kita bisa fine tune LLM dengan hardware resource yang minim (relatif juga sebenernya). Jadi, kalau kita fine tune pakai LoRA, kita nggak akan training seluruh weights dari model kita, melainkan cuma adapter-nya aj
Ane kapan hari baca paper yang menurut ane menarik, judulnya "Lost in the Middle: How Language Models Use Long Contexts" . Jadi ini paper ngebahas tentang bagaimana si LLM menggunakan konteks yang kita berikan, kalau agan pernah bikin chatbot pakai Lang Chain pasti familiar dengan task ...
ane udah nyoba HiMuslim gan, overall bagus sih, cuma topik yang dicover belum terlalu banyak. Salam Chat juga pernah nyoba, jawabannya lebih komprehensif sih, cuma mereka nggak nyantumin sumber2 dalam bentuk link gitu, ane takutnya itu sumber2nya fiktif sih
https://s.kaskus.id/images/2023/04/13/11327168_20230413035708.png Yo agan dan sista, ada kabar penting nih buat para penggemar Harry Potter. Katanya sih Warner Bros mau ngerilis ulang si Harry Potter dalam bentuk tv series di HBO Max. Tapi menurut ane sih, itu bukan ide yang bagus deh. Emang sih, H