EN

A Google bemutatta a gyógyszerfejlesztés felgyorsítását segítő TxGemma modellcsaládot

A Google bemutatta a gyógyszerfejlesztés felgyorsítását segítő TxGemma modellcsaládot
Kép: Freepik via freepik licence

A Google 2025. március 25-én hivatalosan bejelentette a TxGemma modellek kiadását, amelyek a gyógyszerfejlesztés hatékonyságának növelésére szolgáló, nyílt forráskódú AI-modellek. A Gemma 2-n alapuló TxGemma három méretben (2B, 9B és 27B paraméter) érhető el, és kifejezetten arra tanították, hogy megértse és előrejelezze a terápiás vegyületek tulajdonságait a felfedezéstől a klinikai vizsgálatokig terjedő teljes fejlesztési folyamat során. A modellek a hét millió terápiás képzési példán finomhangolt mesterséges intelligenciának köszönhetően potenciálisan lerövidíthetik a laboratóriumból a betegágyig vezető utat, miközben csökkentik a hagyományos módszerekkel járó költségeket, ahol a gyógyszerjelöltek 90%-a a fázis 1 vizsgálatokat követően kudarcot vall.

A TxGemma a 'predict' (előrejelző) és 'chat' (beszélgető) verziókban érhető el, amelyek különböző felhasználási eseteket szolgálnak ki. Az előrejelző modellek 66 terápiás fejlesztési feladatban mutattak kiemelkedő teljesítményt, felülmúlva vagy megközelítve az eddigi legjobb általános modellt 64 feladatban, és versenyképesek az egyes feladatokra specializált modellekkel is. Ezzel szemben a chat modellek egyedülálló módon képesek magyarázatot adni előrejelzéseikre, valamint válaszolni a komplexebb kérdésekre is. A TxGemma modellek kulcsfontosságú képessége, hogy a Therapeutic Data Commons (TDC) adatkészleteiből származó kis molekulákra, fehérjékre, nukleinsavakra, betegségekre és sejtvonalakra vonatkozó átfogó adathalmazon képezték ki őket, így képesek osztályozási, regressziós és generatív feladatok széles körének elvégzésére.

A TxGemma képességei tovább bővíthetők az Agentic-Tx keretrendszerrel, egy olyan terápiás fókuszú ágenssel, amely a Gemini 2.5 technológiára épül. Ez a rendszer 18 eszközzel van felszerelve, beleértve a TxGemmát, általános keresőeszközöket és specifikus molekuláris, valamint fehérje eszközöket, amelyek együttesen lehetővé teszik komplex munkafolyamatok kezelését. Az Agentic-Tx kiemelkedő eredményeket ért el a kémiai és biológiai feladatokban, a ChemBench és a Humanity's Last Exam teljesítménymutatóin. A Google a TxGemma modelleket a Vertex AI Model Garden és a Hugging Face platformokon keresztül tette elérhetővé, és számos Colab notebookot is kiadott, amelyek bemutatják a modellek használatát következtetésre, finomhangolásra és ügynök alapú munkafolyamatokra, ezzel segítve a gyógyszerkutatókat saját terápiás fejlesztési problémáik megoldásában.

Források:
1.

Introducing TxGemma: Open models to improve therapeutics development- Google Developers Blog
TxGemma is a collection of open models designed to improve efficiency of therapeutic development using language models.

2.

TxGemma: Efficient and Agentic LLMs for Therapeutics
Therapeutic development is a costly and high-risk endeavor that is often plagued by high failure rates. To address this, we introduce TxGemma, a suite of efficient, generalist large language models (LLMs) capable of therapeutic property prediction as well as interactive reasoning and explainability. Unlike task-specific models, TxGemma synthesizes information from diverse sources, enabling broad application across the therapeutic development pipeline. The suite includes 2B, 9B, and 27B parameter models, fine-tuned from Gemma-2 on a comprehensive dataset of small molecules, proteins, nucleic acids, diseases, and cell lines. Across 66 therapeutic development tasks, TxGemma achieved superior or comparable performance to the state-of-the-art generalist model on 64 (superior on 45), and against state-of-the-art specialist models on 50 (superior on 26). Fine-tuning TxGemma models on therapeutic downstream tasks, such as clinical trial adverse event prediction, requires less training data than fine-tuning base LLMs, making TxGemma suitable for data-limited applications. Beyond these predictive capabilities, TxGemma features conversational models that bridge the gap between general LLMs and specialized property predictors. These allow scientists to interact in natural language, provide mechanistic reasoning for predictions based on molecular structure, and engage in scientific discussions. Building on this, we further introduce Agentic-Tx, a generalist therapeutic agentic system powered by Gemini 2.5 that reasons, acts, manages diverse workflows, and acquires external domain knowledge. Agentic-Tx surpasses prior leading models on the Humanity’s Last Exam benchmark (Chemistry & Biology) with 52.3% relative improvement over o3-mini (high) and 26.7% over o3-mini (high) on GPQA (Chemistry) and excels with improvements of 6.3% (ChemBench-Preference) and 2.4% (ChemBench-Mini) over o3-mini (high).

3.

TxGemma | Health AI Developer Foundations | Google for Developers