 Czym jest model LLM? LLM to sieć neuronowa zaprojektowana do rozumienia ludzkiego języka, zdolna do generowania tekstu i reagowania na tekst w sposób podobny do tego, w jaki robią to ludzie. Modele LLM są głębokimi sieciami neuronowymi przeszkolonymi na ogromnych ilościach danych tekstowych, czasami obejmujących duże fragmenty całego tekstu publicznie dostępnego w internecie. Słowo „duży” w nazwie „duży model językowy” odnosi się zarówno do rozmiaru modelu wyrażonego liczbą parametrów, jak i do ogromnego zbioru danych, na którym go przeszkolono. Takie modele często mają dziesiątki, a nawet setki miliardów parametrów. Są to dostrajalne wagi w sieci, optymalizowane podczas szkolenia w celu prognozowania następnego słowa w sekwencji. Prognozowanie następnego słowa ma sens, ponieważ wykorzystuje sekwencyjną naturę języka w kontekście szkolenia modeli w zakresie rozumienia kontekstu, struktury i relacji w tekście. Jest to jednak bardzo proste zadanie, dlatego wielu badaczy jest zaskoczonych tym, że w ten sposób można stworzyć tak sprawne modele. Modele LLM wykorzystują architekturę określaną jako transformer, dzięki której podczas tworzenia prognoz mogą selektywnie zwracać uwagę na różne części danych wejściowych. Dzięki temu stają się szczególnie biegłe w radzeniu sobie z niuansami i złożonością ludzkiego języka. Ponieważ modele LLM są zdolne do generowania tekstu, określa się je również jako formę generatywnej sztucznej inteligencji, nazywanej często w skrócie GenAI. Jak pokazano na rysunku, sztuczna inteligencja obejmuje szerszą dziedzinę maszyn zdolnych do tworzenia, które umieją wykonywać zadania wymagające inteligencji podobnej do ludzkiej, w tym rozumienia języka, rozpoznawania wzorców i podejmowania decyzji. Sztuczna inteligencja obejmuje takie poddziedziny jak uczenie maszynowe i uczenie głębokie.
BESTSELLER #1!  Stwórz własne AI. Jak od podstaw zbudować duży model językowy 🤖🪴 Duże modele językowe przestały już być szokującą nowinką technologiczną. Dziś są używane do najróżniejszych celów, a lista ich rzeczywistych i potencjalnych zastosowań stale się wydłuża. A to oznacza, że programiści, inżynierowie i architekci muszą dogłębnie rozumieć zasady działania LLM, a także techniki ich budowania. W tej unikalnej książce znajdziesz kompleksowe omówienie procesu tworzenia LLM, od pracy z zestawami danych po implementację architektury modelu, wstępne szkolenie na nieoznakowanych danych i dostrajanie do określonych zadań. Bez korzystania z gotowych bibliotek LLM samodzielnie zbudujesz podstawowy model, przekształcisz go w klasyfikator tekstu, a ostatecznie stworzysz chatbota, który będzie wykonywał Twoje polecenia. I co najważniejsze ― naprawdę zrozumiesz, jak działa model, w końcu będziesz jego twórcą! Z tą książką: ✅ zaprojektujesz i zbudujesz funkcjonujący model LLM ✅ nauczysz się korzystać ze wstępnie wyuczonych wag ✅ skonstruujesz kompletny potok szkoleniowy ✅ dostosujesz model LLM do zadań klasyfikacji tekstu ✅ stworzysz model LLM zdolny do wykonywania przekazywanych mu instrukcji Pozostałe NOWOŚCI z zakresu AI i nie tylko 🆕🧠 | | | | (druk) | (druk) | (druk) | (druk) | My, programiści. Kronika koderów od Ady do AI | Ataki na AI, środki neutralizujące i strategie obronne. Przewodnik dla specjalistów ds. cyberbezpieczeństwa po atakach adwersarialnych, modelowaniu zagrożeń i wprowadzaniu zabezpieczeń zgodnych ze strategią MLSecOps | Programowanie wspomagane AI. Automatyzacja pracy programisty dzięki ChatGPT i GitHub Copilot | Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i realizuj fascynujące projekty. Wydanie II | Robert C. Martin | John Sotiropoulos | Christoffer Noring, Anjali Jain, Marina Fernandez, Ayşe Mutlu, Ajit Jaokar | Olivier Caelen, Marie-Alice Blete | | 89,00 zł | | najniższa cena z 30 dni | | | 129,00 zł | | najniższa cena z 30 dni | | | 129,00 zł | | najniższa cena z 30 dni | | | 79,00 zł | | najniższa cena z 30 dni | | Jeszcze tylko dziś i jutro! 🌴📚👇  Sprawdź naszą nową aplikację | |