Mertkan Forum

--- # NVIDIA NIM İncelemesi: En İyi Açık Kaynak Yapay Zeka Modellerine Ücretsiz API Erişimi Merhaba arkadaşlar, Bugün özellikle yerel LLM/SLM (Büyük ve Küçük Dil Modelleri) geliştiren, çıkarım (inference) sürelerini optimize etmeye çalışan veya projelerinde yüksek performanslı yapay zeka API'leri arayan herkesin radarında olması gereken bir platformdan bahsetmek istiyorum: **NVIDIA NIM (NVIDIA Inference Microservices)**. Bulut tabanlı testler yapmak ve donanım limitlerine takılmadan en güncel modelleri denemek için şu an piyasadaki en pratik çözümlerden biri. "Try NVIDIA NIM" portalı üzerinden bu apilere istediğimiz gibi erişebiliyoruz. ### NVIDIA NIM Nedir? **NVIDIA NIM**, açık kaynaklı ve ticari yapay zeka modellerini (Llama 3, Mistral, Gemma vb.) tarayıcı üzerinden veya standart endüstri API'leri aracılığıyla hızlıca dağıtmanızı ve kullanmanızı sağlayan bir mikro hizmet mimarisidir. NVIDIA'nın kendi TensorRT-LLM optimizasyonlarıyla çalıştığı için inanılmaz bir hız (token/sn) sunar. ### Neden Kullanmalıyız? Öne Çıkan Avantajlar Eğer sistem kaynakları kısıtlı cihazlarda (Raspberry Pi kümeleri, eski nesil bilgisayarlar) veya standart tüketici donanımlarında modelleri test ediyorsanız, NIM harika bir bulut alternatifi sunuyor: * **OpenAI API Uyumluluğu:** En güzel yanı bu! Mevcut projelerinizde (LangChain, LlamaIndex vb.) sadece `base_url` ve API anahtarını değiştirerek sistemlerinizi doğrudan NVIDIA'nın sunucularına bağlayabilirsiniz. Kodunuzu baştan yazmanıza gerek kalmaz. * **Geniş Model Yelpazesi:** Meta Llama 3 (8B, 70B), Mistral, Google Gemma ve Mixtral gibi popüler modeller tek tıkla elinizin altında. * **Ücretsiz Test ve Geliştirme:** "Try NVIDIA NIM" sitesi, geliştiricilere modelleri istedikleri gibi test etmeleri için oldukça cömert ücretsiz krediler sunuyor. * **Gecikmesiz Çıkarım (Low-Latency Inference):** Donanım tabanlı optimizasyonlar sayesinde yanıt süreleri minimumda tutuluyor. ### Nasıl Kullanılır? (Adım Adım Hızlı Başlangıç) Sisteme entegre olmak sadece birkaç dakikanızı alıyor: 1. **[NVIDIA API Portalına](https://build.nvidia.com)** giriş yapın. 2. Kullanmak istediğiniz modeli seçin (Örneğin: `meta/llama3-70b-instruct`). 3. Sağ üst köşeden bir **API Key** oluşturun. 4. Standart HTTP istekleriyle (veya kütüphanelerle) projenize bağlayın. ### 💻 Örnek Python Entegrasyonu Aşağıdaki kod bloğunda, standart `openai` Python kütüphanesini kullanarak NVIDIA NIM üzerinden nasıl Llama-3 çalıştırabileceğinizi görebilirsiniz: ```python from openai import OpenAI # NVIDIA NIM'in Base URL'ini ve kendi API anahtarınızı girin client = OpenAI( base_url = "https://integrate.api.nvidia.com/v1", api_key = "YOUR_NVIDIA_API_KEY" ) # İstediğiniz modeli çağırın completion = client.chat.completions.create( model="meta/llama3-70b-instruct", messages=[{"role":"user","content":"GGUF formatında yerel model çalıştırmanın avantajları nelerdir?"}], temperature=0.5, top_p=1, max_tokens=1024, stream=True ) # Çıktıyı stream (akış) olarak konsola yazdırın for chunk in completion: if chunk.choices[0].delta.content is not None: print(chunk.choices[0].delta.content, end="") ``` ### Sonuç Eğer yapay zeka asistanları, otonom agent'lar veya veri analizi araçları kodluyorsanız ve API maliyetleri/hız dengesi sizi zorluyorsa NVIDIA NIM'i kesinlikle denemelisiniz. Aranızda daha önce NVIDIA NIM deneyen veya projelerine entegre eden var mı? Özellikle inference hızı konusunda siz ne düşünüyorsunuz? ---