{"id":6941,"date":"2020-12-15T15:51:32","date_gmt":"2020-12-15T15:51:32","guid":{"rendered":"https:\/\/bluetab.net\/?p=6941"},"modified":"2020-12-15T15:51:32","modified_gmt":"2020-12-15T15:51:32","slug":"5-errores-comunes-en-redshift","status":"publish","type":"post","link":"https:\/\/bluetab.net\/en\/2020\/12\/5-errores-comunes-en-redshift\/","title":{"rendered":"5 errores comunes en Redshift"},"content":{"rendered":"<h1>5 errores comunes en Redshift<\/h1>\n<figure><a href=\"https:\/\/www.linkedin.com\/in\/alvsanand\/\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" width=\"150\" height=\"150\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-150x150.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-150x150.jpg 150w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-300x300.jpg 300w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-75x75.jpg 75w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos.jpg 500w\" sizes=\"(max-width: 150px) 100vw, 150px\"><\/a><\/figure>\n<h4><a href=\"https:\/\/www.linkedin.com\/in\/alvsanand\/\" target=\"_blank\" rel=\"noopener\">Alvaro Santos<\/a><\/h4>\n<p>Senior Cloud Solution Architect\u200b<\/p>\n<p>Share on twitter<br \/>\nShare on linkedin<\/p>\n<p><a href=\"https:\/\/aws.amazon.com\/es\/redshift\/?whats-new-cards.sort-by=item.additionalFields.postDateTime&amp;whats-new-cards.sort-order=desc\">Amazon Redshift<\/a> se puede considerar como unos de los data warehouse m\u00e1s importantes de la actualidad y que ofrece <a href=\"https:\/\/aws.amazon.com\/es\/\">AWS<\/a> en su nube. Trabajando en <a href=\"\/soluciones\/data-strategy\/\">Bluetab<\/a>, hemos tenido el placer de usarlo en muchas ocasiones con nuestros momentos buenos \/ malos al igual que este a\u00f1o 2020. Por ello, hemos creado una lista con los errores m\u00e1s comunes que deb\u00e9is evitar y que esperemos os sirvan de gran ayuda.<\/p>\n<p>En&nbsp;<a href=\"https:\/\/bluetab.net\/\">Bluetab<\/a>&nbsp;llevamos desde hace m\u00e1s de 10 a\u00f1os trabajando alrededor del dato. En muchos de los cuales, hemos ayudado en la evoluci\u00f3n tecnol\u00f3gica de muchas empresas migrando sus entornos tradicionales anal\u00edticos y BI de&nbsp;<a href=\"https:\/\/en.wikipedia.org\/wiki\/Data_warehouse\">Data Warehouse<\/a>&nbsp;a entornos de&nbsp;<a href=\"https:\/\/en.wikipedia.org\/wiki\/Big_data\">Big Data<\/a>.<\/p>\n<p>Adem\u00e1s desde la&nbsp;<strong>Pr\u00e1ctica Cloud<\/strong>&nbsp;hemos participado en migraciones a la nube y nuevos desarrollos de proyectos de Big Data la nube de&nbsp;<a href=\"https:\/\/aws.amazon.com\/\">Amazon Web Services<\/a>&nbsp;y&nbsp;<a href=\"https:\/\/cloud.google.com\/\">Google Cloud<\/a>. Toda esta experiencia nos ha permitido crear un grupo de personas muy cualificadas que piensan\/trabajan por\/para la nube.<\/p>\n<p>Para ayudaros con vuestros trabajos en la nube, os queremos presentar los errores m\u00e1s comunes que hemos encontrado a la hora de trabajar con&nbsp;<a href=\"https:\/\/aws.amazon.com\/es\/redshift\">Redhisft<\/a>, la herramienta de DW m\u00e1s importante que ofrece AWS.<\/p>\n<p>Aqu\u00ed ten\u00e9is la lista de ellos:<\/p>\n<ol>\n<li>Trabajar como si fuera un PostgreSQL.<\/li>\n<li>Cargar datos de aquella manera.<\/li>\n<li>Dimensionar mal el cluster.<\/li>\n<li>No hacer uso de workload management (WLM).<\/li>\n<li>Desentenderse del mantenimiento<\/li>\n<\/ol>\n<h2>Qu\u00e9 es Redshift<\/h2>\n<p>Amazon Redshift es un base de datos anal\u00edtica (OLAP) en la nube muy r\u00e1pida y totalmente administrada por AWS. Con ella se simplifica y mejora el an\u00e1lisis de datos utilizando SQL est\u00e1ndar compatible con la mayor\u00eda de las herramientas de BI existentes.<\/p>\n<p>Las caracter\u00edsticas m\u00e1s importantes de Amazon Redshift son:<\/p>\n<ul>\n<li><strong>Almacenamiento de datos en columnas<\/strong>: en lugar de almacenar datos como una serie de filas, Amazon Redshift organiza los datos por columna. Dado que solo se procesan las columnas involucradas en las consultas y los datos en columnas se almacenan secuencialmente en los medios de almacenamiento, los sistemas basados \u200b\u200ben columnas requieren muchas menos I\/O, lo que mejora enormemente el rendimiento de las consultas.<\/li>\n<li><strong>Compresi\u00f3n avanzada<\/strong>: las bases de datos columnares se pueden comprimir mucho m\u00e1s que las basados \u200b\u200ben filas porque los datos similares se almacenan secuencialmente en el disco.<\/li>\n<li><strong>Procesamiento masivo paralelo (MPP)<\/strong>: Amazon Redshift distribuye autom\u00e1ticamente la carga de datos y consultas en todos los nodos.<\/li>\n<li><strong>Redshift Spectrum<\/strong>: Redshift Spectrum le permite ejecutar consultas en exabytes de datos almacenados en Amazon S3.<\/li>\n<li><strong>Vistas materializadas<\/strong>: las consultas posteriores que hacen referencia a las vistas materializadas utilizan los resultados pre.calculados para ejecutarse mucho m\u00e1s r\u00e1pido. Las vistas materializadas se pueden crear en base a una o m\u00e1s tablas de origen utilizando filtros, proyecciones, combinaciones internas, agregaciones, agrupaciones, funciones y otras construcciones SQL.<\/li>\n<li><strong>Escalabilidad<\/strong>: Redshift tiene la capacidad de escalar su procesamiento y almacenamiento aumentado el tama\u00f1o de cluster a cientos de nodos.<\/li>\n<\/ul>\n<p>Amazon Redshift no es igual que otros sistemas SQL de base de datos. Para aprovechar adecuadamente todos sus beneficios es necesario que se sigan una buenas practicas, de esa manera el cluster funcionar\u00e1 de manera \u00f3ptima.<\/p>\n<h2>1. Trabajar como si fuera un PostgreSQL<\/h2>\n<p>Un error muy com\u00fan que cometemos al comenzar a usar Redshift, es suponer que Redshift es simplemente un&nbsp;<a href=\"https:\/\/www.postgresql.org\/\">PostgreSQL<\/a>&nbsp;vitaminado y que partiendo de un schema compatible con \u00e9l puedes empezar a trabajar con Redshift. Sin embargo, no podr\u00edas estar m\u00e1s equivocado.<\/p>\n<p><img decoding=\"async\" width=\"400\" height=\"400\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-i-know-redshift.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-i-know-redshift.jpg 400w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-i-know-redshift-300x300.jpg 300w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-i-know-redshift-150x150.jpg 150w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-i-know-redshift-75x75.jpg 75w\" sizes=\"(max-width: 400px) 100vw, 400px\"><br \/>\nAunque es cierto que Redshift se bas\u00f3 en una versi\u00f3n antigua de PostgreSQL 8.0.2, su arquitectura ha cambiado radicalmente y ha sido optimizada durante a\u00f1os para mejorar el redimiendo para su estrictamente anal\u00edtico. Por ellos es necesario:<\/p>\n<ul>\n<li>Dise\u00f1ar las tablas de manera adecuada.<\/li>\n<li>Lanzar consultas optimizadas para entornos&nbsp;<a href=\"https:\/\/en.wikipedia.org\/wiki\/Massively_parallel\">MPP<\/a>.<\/li>\n<\/ul>\n<h4 id=\"dise\u00f1ar-las-tablas-de-manera-adecuada\"><strong><br \/>\nDise\u00f1ar las tablas de manera adecuada<\/strong><\/h4>\n<p>Cuando se dise\u00f1a la base de datos ten en cuenta que algunas decisiones clave sobre el dise\u00f1o de las tablas influyen considerablemente en el rendimiento general de la consulta. Unas buenas practicas son:<\/p>\n<ul>\n<li>Seleccionar el tipo de distribuci\u00f3n de datos \u00f3ptima:<br \/>\n<img decoding=\"async\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-redshift_dist_key-300x244.gif\" alt=\"\" width=\"100%\" height=\"auto\"><\/p>\n<ul>\n<li>Para las tablas de hechos (facts) elige el tipo&nbsp;<code>DISTKEY<\/code>. De esta manera los datos se distribuir\u00e1n en los diferentes nodos agrupados por los valores de la clave elegida. Esto te permitir\u00e1 realizar consultas de tipo&nbsp;<code>JOIN<\/code>&nbsp;sobre esa columna de manera muy eficiente.<\/li>\n<li>Para las tablas de dimensiones (dimensions) con un pocos de millones de entradas elige el tipo&nbsp;<code>ALL<\/code>. Aquellas tablas que son com\u00fanmente usadas en&nbsp;<em>joins<\/em>&nbsp;de tipo diccionario es recomendable que se copien a todos los nodos. De esta manera la sentencia&nbsp;<code>JOIN<\/code>&nbsp;realizada con tablas de hechos mucho m\u00e1s grandes se ejecutar\u00e1 mucho m\u00e1s r\u00e1pido.<\/li>\n<li>Cuando no tengas claro como vas a realizar la consulta sobre una tabla muy grande o simplemente no tenga ninguna relaci\u00f3n con el resto, elige el tipo&nbsp;<code>EVEN<\/code>. De esta forma los datos se distribuir\u00e1n de manera aleatoria.<\/li>\n<\/ul>\n<\/li>\n<li>Usa la compresi\u00f3n autom\u00e1tica permitiendo a Redshift que seleccione el tipo m\u00e1s optimo para cada columna. Esto lo consigue realizando un escaneo sobre un n\u00famero limitado de elementos.<\/li>\n<\/ul>\n<h4 id=\"usar-consultas-optimizadas-para-entornos-mpp\"><strong><br \/>\nUsar consultas optimizadas para entornos MPP<\/strong><\/h4>\n<p>Puesto que Redshift es un entorno MPP distribuido, es necesario maximizar el rendimiento de las consultas siguiendo unas recomendaciones b\u00e1sicas. Unas buenas practicas son:<\/p>\n<ul>\n<li>Las tablas tiene que dise\u00f1arse pensando en las consultas que se van a realizar. Por lo tanto, si una consulta no encaja es necesario que revises el dise\u00f1o de las tablas que participan.<\/li>\n<li>Evite usar&nbsp;<code>SELECT *.<\/code>&nbsp;e incluye solo las columnas que necesites.<\/li>\n<li>No uses&nbsp;<em>cross-joins<\/em>&nbsp;a no ser que sea necesario.<\/li>\n<li>Siempre que puedas, usa la sentencia&nbsp;<code>WHERE<\/code>&nbsp;para restringir la cantidad de datos a leer.<\/li>\n<li>Use claves de ordenaci\u00f3n en las cl\u00e1usulas&nbsp;<code>GROUP BY<\/code>&nbsp;y&nbsp;<code>SORT BY<\/code>&nbsp;para que el planificador de consultas pueda usar una agregaci\u00f3n m\u00e1s eficiente.<\/li>\n<\/ul>\n<h2>2. Cargar datos de aquella manera<\/h2>\n<p>Cargar conjuntos de datos muy grandes puede tomar mucho tiempo y consumir gran cantidad de recursos del cluster. Adem\u00e1s si esta carga se realiza de manera inadecuada tambi\u00e9n puede afectar el rendimiento de las consultas.<\/p>\n<p><img decoding=\"async\" width=\"602\" height=\"327\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-load_redshift.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-load_redshift.png 602w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-load_redshift-300x163.png 300w\" sizes=\"(max-width: 602px) 100vw, 602px\"><\/p>\n<p>Por ello, es recomendable seguir estas pautas:<\/p>\n<ul>\n<li>Usa siempre el comando&nbsp;<code>COPY<\/code>&nbsp;para cargar los datos en paralelo desde Amazon S3, Amazon EMR, Amazon DynamoDB o desde distintos or\u00edgenes de datos en hosts remotos.<\/li>\n<\/ul>\n<pre><code class=\"language-python\"> copy customer from 's3:\/\/mybucket\/mydata' iam_role 'arn:aws:iam::12345678901:role\/MyRedshiftRole'; <\/code><\/pre>\n<ul>\n<li>Si es posible, lanza un solo comando en vez de varios. Puedes usar un fichero&nbsp;<em>manifest<\/em>&nbsp;o patrones para cargar varios ficheros de una sola vez.<\/li>\n<li>Divide los archivos de datos de carga de tal modo que sean:\n<ul>\n<li>De igual tama\u00f1o, entre 1 MB y 1 GB, despu\u00e9s de la compresi\u00f3n.<\/li>\n<li>Un m\u00faltiplo del n\u00famero de slices de tu cluster.<\/li>\n<\/ul>\n<\/li>\n<li>Para actualizar los datos e insertar datos nuevos de manera eficiente al cargarlos usa una tabla provisional.<\/li>\n<\/ul>\n<pre><code class=\"language-python\">  -- Crea una tabla provisional y, luego, compl\u00e9tala con los datos que se fusionar\u00e1n.\n  create temp table stage (like target); \n  insert into stage \n  select * from source \n  where source.filter = 'filter_expression';\n  -- Usa una combinaci\u00f3n interna con la tabla provisional para eliminar las filas de la tabla destino que se est\u00e1n actualizando.\n  begin transaction;\n  delete from target \n  using stage \n  where target.primarykey = stage.primarykey; \n  -- Inserta todas las filas de la tabla provisional.\n  drop table stage;\n  insert into target \n  select * from stage;\n  end transaction;\n  -- Elimina la tabla provisional.\n  drop table stage; <\/code><\/pre>\n<h2>3. Dimensionar mal el cluster<\/h2>\n<p>A lo largo de los a\u00f1os hemos visto muchos clientes que ten\u00edan graves problemas de rendimiento con Redshift debido a fallos de dise\u00f1o de sus BBDD. Muchos de ellos hab\u00edan intentado resolverlos a\u00f1adiendo m\u00e1s recursos al cluster en vez de intentar solucionar el problema de ra\u00edz.<\/p>\n<p>Por ellos te propongo que sigas el siguiente flujo para dimensionar tu cluster:<\/p>\n<ul>\n<li>Recolecta informaci\u00f3n sobre el tipo de consultas a realizar, tama\u00f1o de los datos, concurrencia esperada, etc.<\/li>\n<li>Dise\u00f1a tus tablas en base a las consultas que se vayan a realizar.<\/li>\n<li>Dependiendo del tipo de consultas (sencillas, largas, complejas\u2026), selecciona el tipo de instancia de Redshift (DC2, DS2 o RA3).<\/li>\n<li>Teniendo en cuenta el tama\u00f1o del dataset, calcula el n\u00famero nodos de tu cluster.<\/li>\n<\/ul>\n<pre><code class=\"language-python\"># of  Redshift nodes = (uncompressed data size) * 1.25 \/ (storage capacity of selected Redshift node type)  <\/code><\/pre>\n<blockquote><p>\n\t\t\t\t\u00ab Para el c\u00e1lculo del tama\u00f1o de almacenamiento, se recomienda tener adem\u00e1s un margen mayor para realizar tareas de mantenimiento. \u00bb<\/p><\/blockquote>\n<ul>\n<li>Realizar pruebas de carga para comprobar el rendimiento.<\/li>\n<li>En el caso de no funcionar adecuadamente, optimiza las queries modificando el dise\u00f1o de las tablas incluso si fuera necesario.<\/li>\n<li>Finalmente, si no fuera suficiente, itera hasta encontrar el dimensionamiento adecuado de nodos y tama\u00f1os.<\/li>\n<\/ul>\n<h2>4. No hacer uso de workload management (WLM)<\/h2>\n<p>Es bastante probable que vuestro caso de uso necesite que existan varias sesiones o usuarios que est\u00e9n ejecutando consultas al mismo tiempo. En estos casos, algunas consultas pueden consumir recursos del cl\u00faster durante periodos de tiempo prolongados y afectar al rendimiento de las otras consultas. En esta situaci\u00f3n, es posible que las consultas sencillas tendr\u00e1n que esperar hasta que se complete las consultas m\u00e1s largas.<\/p>\n<p>Mediante el uso de&nbsp;<a href=\"https:\/\/docs.aws.amazon.com\/redshift\/latest\/dg\/cm-c-implementing-workload-management.html\">WLM<\/a>, vamos a poder administrar la prioridad y capacidad de los diferentes tipos de ejecuciones creando diferente colas de ejecuci\u00f3n.<\/p>\n<p><img decoding=\"async\" width=\"800\" height=\"511\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-wlm_example.gif\" alt=\"\" loading=\"lazy\"><\/p>\n<p>Es posible configurar la WLM de Amazon Redshift para su ejecuci\u00f3n de dos maneras diferentes:<\/p>\n<ul>\n<li><strong>Automatic WLM<\/strong>: la manera m\u00e1s recomendada es habilitar Amazon Redshift para que administre c\u00f3mo se dividen los recursos para ejecutar consultas simult\u00e1neas con WLM autom\u00e1tico. El usuario gestiona la prioridad de las colas y Amazon Redshift determina cu\u00e1ntas consultas se ejecutan simult\u00e1neamente y cu\u00e1nta memoria se asigna a cada consulta enviada.<\/li>\n<li><strong>Manual WLM<\/strong>: alternativamente, se puede configurar de manera manual el uso de recursos de diferente colas. En tiempo de ejecuci\u00f3n, se pueden enviar consultas a diferentes colas con diferentes par\u00e1metros de concurrencia y memoria gestionados por el usuario.<\/li>\n<\/ul>\n<h4 id=\"c\u00f3mo-funciona-wlm\"><strong><br \/>\nC\u00f3mo funciona WLM<\/strong><\/h4>\n<p>Cuando un usuario ejecuta una consulta, WLM asigna la consulta a la primera cola coincidente, en funci\u00f3n de las reglas de asignaci\u00f3n de cola de WLM.<\/p>\n<p><img decoding=\"async\" width=\"436\" height=\"579\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-wlm_diagram.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-wlm_diagram.png 436w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-wlm_diagram-226x300.png 226w\" sizes=\"(max-width: 436px) 100vw, 436px\"><\/p>\n<ul>\n<li>Si un usuario inici\u00f3 sesi\u00f3n como&nbsp;<em>superusuario<\/em>&nbsp;y ejecuta una consulta en el grupo de consultas con la etiqueta super usuario, la consulta se asigna a la cola&nbsp;<em>superusuario<\/em>.<\/li>\n<li>Si un usuario pertenece a un grupo de usuarios de la lista o ejecuta una consulta dentro del grupo de consultas de la lista, la consulta se asigna a la primera cola coincidente.<\/li>\n<li>Si una consulta no cumple con ning\u00fan criterio, la consulta se asigna a la cola predeterminada, que es la \u00faltima cola definida en la configuraci\u00f3n de WLM.<\/li>\n<\/ul>\n<h2>5. Desentenderse del mantenimiento<\/h2>\n<p>El mantenimiento de la base de datos es un t\u00e9rmino que usamos para describir un conjunto de tareas que se ejecutan con la intenci\u00f3n de mejorar la base de datos. Existen rutinas destinadas a ayudar al rendimiento, liberar espacio en disco, verificar errores de datos, verificar fallos de hardware, actualizar estad\u00edsticas internas y muchas otras cosas oscuras (pero importantes).<\/p>\n<p>En el caso de Redshift, se tiene la falsa sensaci\u00f3n de que al ser un servicio totalmente administrado por Amazon no es necesario realizar ninguna. De esta manera creas el cluster y te olvidas de \u00e9l. Aunque es cierto que AWS te facilita muchas tareas de administraci\u00f3n (crear, parar, arrancar, destruir o realizar backups), esto no podr\u00eda ser m\u00e1s err\u00f3neo.<\/p>\n<p><img decoding=\"async\" width=\"1024\" height=\"576\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-db_maintenance-1024x576-1.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-db_maintenance-1024x576-1.jpg 1024w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-db_maintenance-1024x576-1-300x169.jpg 300w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/redshift-db_maintenance-1024x576-1-768x432.jpg 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\"><\/p>\n<p>Las tareas de mantenimiento m\u00e1s importantes que debes de llevar a cabo en Redshift son:<\/p>\n<ul>\n<li><strong>Motorizaci\u00f3n del sistema<\/strong>: es necesario que se monitorize el cluster 24\/7 y realices revisiones peri\u00f3dicas para comprobar que el sistema funciona correctamente (sin consultas err\u00f3neas o bloqueos, espacio libre, tiempos de respuesta adecuados, etc). Adem\u00e1s es necesario crear alarmas para poder anticiparse ante cualquier futura ca\u00edda del servicio.<\/li>\n<li><strong>Compactaci\u00f3n de las BBDD<\/strong>: Amazon Redshift no realiza todas las tareas de compactaci\u00f3n en todas las situaciones autom\u00e1ticamente y otras veces vas a necesitar ejecutarlas de manera manual. Este proceso es denominado&nbsp;<code>VACUUM<\/code>&nbsp;y es necesario ejecutarlo manualmente para poder hacer uso de&nbsp;<code>SORT KEYS<\/code>&nbsp;de tipo&nbsp;<code>INTERLEAVED<\/code>. Este es un proceso bastante largo y costoso que va a tener que hacerlo a poder ser, en las ventanas de mantenimiento.<\/li>\n<li><strong>Integridad de los datos<\/strong>: como en toda carga de datos es necesario revisar que los procesos de&nbsp;<em>ETL<\/em>&nbsp;han funcionado adecuadamente. Redshift dispone de tablas de sistema como&nbsp;<code>STV_LOAD_STATE<\/code>&nbsp;en las que es posible encontrar informaci\u00f3n acerca del estado actual de las instrucciones&nbsp;<code>COPY<\/code>&nbsp;en curso. Debes de revisarlas a menudo para comprobar que no hay errores en la integridad de los datos.<\/li>\n<li><strong>Detecci\u00f3n de consultas pesadas<\/strong>: Redshift monitoriza continuamente todas aquellas consultas que est\u00e1n tardando m\u00e1s de lo previsto y que podr\u00edan estar afectando negativamente el rendimiento del servicio. Para que puedas analizar e investigar esas consultas es posible encontrarlas en tablas de sistema como&nbsp;<code>STL_ALERT_EVENT_LOG<\/code>&nbsp;o a trav\u00e9s de la misma consola web de AWS.<\/li>\n<\/ul>\n<h5>\u00bfQuieres saber m\u00e1s de lo que ofrecemos y ver otros casos de \u00e9xito?<\/h5>\n<p><a href=\"\/\" role=\"button\"><br \/>\nDESCUBRE BLUETAB<br \/>\n<\/a><br \/>\nShare on twitter<br \/>\nShare on linkedin<\/p>\n<figure><a href=\"https:\/\/www.linkedin.com\/in\/alvsanand\/\" target=\"_blank\" rel=\"noopener\"><img decoding=\"async\" width=\"150\" height=\"150\" src=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-150x150.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-150x150.jpg 150w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-300x300.jpg 300w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos-75x75.jpg 75w, https:\/\/bluetab.net\/wp-content\/uploads\/2020\/07\/Alvaro-Santos.jpg 500w\" sizes=\"(max-width: 150px) 100vw, 150px\"><\/a><\/figure>\n<p>\u00c1lvaro Santos<br \/>\nSenior Cloud Solution Architect\u200b<\/p>\n<p>Mi nombre es&nbsp;<a href=\"https:\/\/www.linkedin.com\/in\/alvsanand\/\">\u00c1lvaro Santos<\/a>&nbsp;y ejerzo como Solution Architect desde hace m\u00e1s de 5 a\u00f1os. Estoy certificado en&nbsp;<em>AWS<\/em>,&nbsp;<em>GCP<\/em>,&nbsp;<em>Apache Spark<\/em>&nbsp;y alguna que otras m\u00e1s. Entr\u00e9 a formar parte en Bluetab en octubre de 2018 y desde entonces estoy involucrado en proyectos cloud de Banca y Energ\u00eda y adem\u00e1s participo como Cloud Master Partitioner. Soy un apasionado de las nuevas patrones distribuidos, Big Data, Open-source software y cualquier otra cosa de mundo IT que mole.<\/p>\n<p><b>SOLUCIONES, <\/b>SOMOS EXPERTOS<\/p>\n<p><a href=\"\/soluciones\/data-strategy\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-strategy\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-strategy\/\"><\/p>\n<h5>\n\t\t\t\t\t\tDATA STRATEGY<\/h5>\n<p><\/a><a href=\"\/soluciones\/data-strategy\/\"><\/a><a href=\"\/soluciones\/data-strategy\/\">\t\t\t\t\t\t<\/a><br \/>\n<a href=\"\/soluciones\/data-fabric\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-fabric\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/data-fabric\/\"><\/p>\n<h5>\n\t\t\t\t\t\tDATA FABRIC<\/h5>\n<p><\/a><a href=\"\/soluciones\/data-fabric\/\"><\/a><a href=\"\/soluciones\/data-fabric\/\">\t\t\t\t\t\t<\/a><br \/>\n<a href=\"\/soluciones\/augmented-analytics\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/augmented-analytics\/\"><\/a><\/p>\n<p><a href=\"\/soluciones\/augmented-analytics\/\"><\/p>\n<h5>\n\t\t\t\t\t\tAUGMENTED ANALYTICS<\/h5>\n<p><\/a><a href=\"\/soluciones\/augmented-analytics\/\"><\/a><a href=\"\/soluciones\/augmented-analytics\/\">\t\t\t\t\t\t<\/a><\/p>\n<p>Te puede interesar<\/p>\n","protected":false},"excerpt":{"rendered":"<p>5 errores comunes en Redshift Alvaro Santos Senior Cloud Solution Architect\u200b Share on twitter Share on linkedin Amazon Redshift se puede considerar como unos de los data warehouse m\u00e1s importantes de la actualidad y que ofrece AWS en su nube. Trabajando en Bluetab, hemos tenido el placer de usarlo en muchas ocasiones con nuestros momentos [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":20779,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"elementor_header_footer","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[7,8,9],"tags":[],"class_list":["post-6941","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog-es","category-practices","category-tech"],"acf":[],"jetpack_featured_media_url":"https:\/\/bluetab.net\/wp-content\/uploads\/2020\/12\/13.png","_links":{"self":[{"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/posts\/6941","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/comments?post=6941"}],"version-history":[{"count":0,"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/posts\/6941\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/media\/20779"}],"wp:attachment":[{"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/media?parent=6941"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/categories?post=6941"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bluetab.net\/en\/wp-json\/wp\/v2\/tags?post=6941"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}