ODBIERZ TWÓJ BONUS :: »

Generative AI on Kubernetes. Operationalizing Large Language Models Roland Huß, Daniele Zonca

(ebook) (audiobook) (audiobook) Język publikacji: angielski
Generative AI on Kubernetes. Operationalizing Large Language Models Roland Huß, Daniele Zonca - okladka książki

Generative AI on Kubernetes. Operationalizing Large Language Models Roland Huß, Daniele Zonca - okladka książki

Generative AI on Kubernetes. Operationalizing Large Language Models Roland Huß, Daniele Zonca - audiobook MP3

Generative AI on Kubernetes. Operationalizing Large Language Models Roland Huß, Daniele Zonca - audiobook CD

Autorzy:
Roland Huß, Daniele Zonca
Ocena:
Bądź pierwszym, który oceni tę książkę
Stron:
406
Dostępne formaty:
     ePub
     Mobi
Ebook
169,14 zł 199,00 zł (-15%)
160,65 zł najniższa cena z 30 dni

Dodaj do koszyka lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Generative AI is revolutionizing industries, and Kubernetes has fast become the backbone for deploying and managing these resource-intensive workloads. This book serves as a practical, hands-on guide for MLOps engineers, software developers, Kubernetes administrators, and AI professionals ready to combine AI innovation with the power of cloud native infrastructure. Authors Roland Huß and Daniele Zonca provide a clear road map for training, fine-tuning, deploying, and scaling GenAI models on Kubernetes, addressing challenges like resource optimization, automation, and security along the way.

With actionable insights with real-world examples, readers will learn to tackle the opportunities and complexities of managing GenAI applications in production environments. Whether you're experimenting with large-scale language models or facing the nuances of AI deployment at scale, you'll uncover expertise you need to operationalize this exciting technology effectively.

  • Learn how to deploy LLMs more efficiently with optimized inference runtimes
  • Get hands-on with GPU scheduling, including hardware detection and multinode scaling
  • Monitor and understand LLM-specific metrics like Time to First Token and token throughput
  • Know when to fine-tune a model or when retrieval augmentation is the better choice
  • Discover how to evaluate models with standardized benchmarks before committing GPU resources
  • Learn to run agentic applications with secure tool integration, identity management, and persistent state

O autorze książki

Dr Roland Huss jest starszym inżynierem oprogramowania w firmie Red Hat i członkiem zespołu serverless pracującego nad projektem Knative. Jest też jednym z głównych autorów kilku popularnych narzędzi do programowania w Javie.

O'Reilly Media - inne książki

Zamknij

Przenieś na półkę
Dodano produkt na półkę
Usunięto produkt z półki
Przeniesiono produkt do archiwum
Przeniesiono produkt do biblioteki
Proszę czekać...
ajax-loader

Zamknij

Wybierz metodę płatności

Ebook
169,14 zł
Dodaj do koszyka
Zamknij Pobierz aplikację mobilną Ebookpoint