{"id":1764,"date":"2024-05-27T04:59:46","date_gmt":"2024-05-27T04:59:46","guid":{"rendered":"https:\/\/elink.cat\/blog\/?p=1764"},"modified":"2025-06-18T14:05:21","modified_gmt":"2025-06-18T14:05:21","slug":"rag-que-es-pros-i-contres","status":"publish","type":"post","link":"https:\/\/elink.cat\/blog\/rag-que-es-pros-i-contres\/","title":{"rendered":"RAG, que \u00e9s , pros i contres"},"content":{"rendered":"<span class=\"span-reading-time rt-reading-time\" style=\"display: block;\"><span class=\"rt-label rt-prefix\">Temps de lectura: <\/span> <span class=\"rt-time\"> 3<\/span> <span class=\"rt-label rt-postfix\">minuts<\/span><\/span><p>En el m\u00f3n de la intel\u00b7lig\u00e8ncia artificial (IA), una de les t\u00e8cniques emergents que est\u00e0 guanyant popularitat \u00e9s el Retrieval-Augmented Generation (RAG). Aquesta t\u00e8cnica combina dos enfocaments principals de la IA: la recuperaci\u00f3 d&#8217;informaci\u00f3 i la generaci\u00f3 de text. Per\u00f2, qu\u00e8 \u00e9s exactament el RAG, i quines s\u00f3n les seves avantatges i inconvenients? Mirem-ho!<\/p>\n<p><strong>Qu\u00e8 \u00e9s el RAG?<\/strong><\/p>\n<p>El Retrieval-Augmented Generation (RAG) \u00e9s un model d&#8217;IA que integra dos components clau:<br \/>\n1. <strong>M\u00f2dul de Recuperaci\u00f3 (Retrieval)<\/strong>:Un component que busca i recupera informaci\u00f3 rellevant d&#8217;una base de dades o d&#8217;un conjunt de documents mitjan\u00e7ant una cerca sem\u00e0ntica i que li retorna al framework unes dades contextuals a la pregunta.<br \/>\n2. <strong>M\u00f2dul de Generaci\u00f3 (Generation):<\/strong> Que utilitza la informaci\u00f3 recuperada per generar respostes o continguts nous coherents i contextualitzats.<\/p>\n<p><img fetchpriority=\"high\" decoding=\"async\" class=\"wp-image-1766 size-full aligncenter\" src=\"https:\/\/elink.cat\/blog\/wp-content\/uploads\/2024\/05\/RAG.png\" alt=\"\" width=\"570\" height=\"424\" srcset=\"https:\/\/elink.cat\/blog\/wp-content\/uploads\/2024\/05\/RAG.png 570w, https:\/\/elink.cat\/blog\/wp-content\/uploads\/2024\/05\/RAG-300x223.png 300w\" sizes=\"(max-width: 570px) 100vw, 570px\" \/><\/p>\n<p>Aquesta combinaci\u00f3 permet al RAG aprofitar grans quantitats de dades existents per generar respostes m\u00e9s precises i informatives, en lloc de confiar \u00fanicament en la seva capacitat de generar text basat en l&#8217;entrenament previ.<\/p>\n<p>Sona fant\u00e0stic no? \u00a0per\u00f2 quines s\u00f3n els avantatges del RAG? T&#8217;ho explico per punts:<\/p>\n<p>1. <strong>Millor Precisi\u00f3 i Relev\u00e0ncia:<\/strong> El RAG pot accedir a informaci\u00f3 actualitzada i espec\u00edfica durant la recuperaci\u00f3, cosa que permet generar respostes molt m\u00e9s precises i pertinents i \u00e9s especialment \u00fatil en camps que requereixen informaci\u00f3 actualitzada constantment.<\/p>\n<p>2. <strong>Context Enriquit:<\/strong> Com que el RAG utilitza informaci\u00f3 recuperada de fonts diverses, permet als models comprendre millor el context de les preguntes i per tant pot proporcionar respostes m\u00e9s detallades.<\/p>\n<p>3. <strong>Escalabilitat:<\/strong> El model RAG pot escalar-se f\u00e0cilment per treballar amb bases de dades grans i diverses.<\/p>\n<p>4. <strong>Flexibilitat<\/strong>: El sistema RAG pot adaptar-se a diferents dominis i tipus de dades, ja que pot ser entrenat amb bases de dades espec\u00edfiques per a cada cas d&#8217;\u00fas. Aix\u00f2 el fa molt vers\u00e0til per a aplicacions personalitzades.<\/p>\n<p>5. <strong>Reducci\u00f3<\/strong> <strong>d&#8217;Al\u00b7lucinacions<\/strong>: Els models de llenguatge de vegades generen respostes que no tenen sentit o s\u00f3n incorrectes; RAG ajuda a reduirles ja que proporciona un context real i verificable.<\/p>\n<p>6. <strong>Reducci\u00f3 de Costos<\/strong>: Com que redueix la necessitat de reentrenar el model cont\u00ednuament amb noves dades, RAG ajuda a disminuir els costos de manteniment de LLM.<\/p>\n<p>Tot i que no tot\u00a0s\u00f3n\u00a0flors i violes,\u00a0tamb\u00e9\u00a0tenim alguns inconvenients:<\/p>\n<p>1.<strong> Depend\u00e8ncia de la Qualitat de les Dades:<\/strong> La precisi\u00f3 del RAG dep\u00e8n en gran mesura de la qualitat i l&#8217;actualitzaci\u00f3 de la base de dades utilitzada per a la recuperaci\u00f3. Si les dades s\u00f3n antigues, incorrectes o incompletes, les respostes generades poden ser inexactes o enganyoses.<\/p>\n<p>2.<strong> Complexitat Computacional:<\/strong> La combinaci\u00f3 de recuperaci\u00f3 i generaci\u00f3 requereix m\u00e9s recursos que els models de generaci\u00f3 de text tradicionals i per tant augmenta els costos i la complexitat de la infraestructura necess\u00e0ria.<\/p>\n<p>3. <strong>Temps de Resposta:<\/strong> La fase de recuperaci\u00f3 d&#8217;informaci\u00f3 pot afegir un retard en el temps de resposta. Tot i que aquest retard sol ser m\u00ednim, impacta negativament en aplicacions que requereixen respostes en temps real.<\/p>\n<p>4. <strong>Riscos de Seguretat i Privacitat:<\/strong> Utilitzar bases de dades grans i diverses pot augmentar els riscos de seguretat i privacitat, especialment si les dades no estan adequadament protegides o si es recupera informaci\u00f3 sensible o confidencial.<\/p>\n<p>Un cop vistos els pros i contres podem resumir que el Retrieval-Augmented Generation (RAG) \u00e9s\u00a0un abans i un despr\u00e9s en la gesti\u00f3 del llenguatge per part de la IA i representa un avan\u00e7 significatiu en la capacitat per generar respostes m\u00e9s precises i contextualitzades. Tot i que ens dona avantatges, com millor precisi\u00f3 i context enriquit, tamb\u00e9 genera problemes importants, com la depend\u00e8ncia de la qualitat de les dades i l&#8217;increment de cost computacional (temps, consum energ\u00e8tic,&#8230;).<\/p>\n<p>De totes maneres, crec que\u00a0ben aviat\u00a0el\u00a0RAG\u00a0es\u00a0convertir\u00e0\u00a0en una eina imprescindible per a qualsevol sistema de IA especialitzat,\u00a0ha\u00a0vingut per quedar-se\u00a0\ud83d\ude09<\/p>\n","protected":false},"excerpt":{"rendered":"<p><span class=\"span-reading-time rt-reading-time\" style=\"display: block;\"><span class=\"rt-label rt-prefix\">Temps de lectura: <\/span> <span class=\"rt-time\"> 3<\/span> <span class=\"rt-label rt-postfix\">minuts<\/span><\/span>En el m\u00f3n de la intel\u00b7lig\u00e8ncia artificial (IA), una de les t\u00e8cniques emergents que est\u00e0 guanyant popularitat \u00e9s el Retrieval-Augmented Generation (RAG). Aquesta t\u00e8cnica combina dos enfocaments principals de la<\/p>\n","protected":false},"author":1,"featured_media":1770,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"breadcrumbs_single_post":"","page_title_panel":"","breadcrumbs_single_page":"","single_page_alignment":"","single_page_margin":"","page_structure_type":"","content_style_source":"","content_style":"","blog_post_streched_ed":"","blog_page_streched_ed":"","has_transparent_header":"","disable_transparent_header":"","vertical_spacing_source":"","content_area_spacing":"","single_post_content_background":"","single_page_content_background":"","single_post_boxed_content_spacing":"","single_page_boxed_content_spacing":"","single_post_content_boxed_radius":"","single_page_content_boxed_radius":"","disable_featured_image":"","disable_post_tags":"","disable_author_box":"","disable_posts_navigation":"","disable_comments":"","disable_related_posts":"","disable_header":"","disable_footer":"","footnotes":""},"categories":[30],"tags":[],"class_list":["post-1764","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-integracions-arquitectures-digitals","rishi-post"],"_links":{"self":[{"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/posts\/1764","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/comments?post=1764"}],"version-history":[{"count":4,"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/posts\/1764\/revisions"}],"predecessor-version":[{"id":1769,"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/posts\/1764\/revisions\/1769"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/media\/1770"}],"wp:attachment":[{"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/media?parent=1764"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/categories?post=1764"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/elink.cat\/blog\/wp-json\/wp\/v2\/tags?post=1764"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}