Microsoft Build 2020: Novedades en Data, Analítica & IoT

Microsoft Build 2020

El 19 y 20 de Mayo pasado la conferencia de Microsoft más importante para desarrolladores se ejecutó en un formato virtual, donde por 48 horas ininterrumpidas la compañía de Redmond brindó contenidos técnicos de todo tipo.

En esta publicación te vamos a contar lo más importante relacionado a Datos y Analítica, incluyendo: Azure Cosmos DB, la base de datos geo-replicada y multi-modelo de Microsoft, Azure Databases for PostgreSQL y MySQL, SQL Edge, Azure Synapse Link, actualizaciones en PowerBI y novedades de certificación en Azure IoT.

Si querés ver un resumen general del Build 2020, visitá la siguiente publicación.

[toc]

Cosmos DB

Cosmos DB es un servicio de base de datos de Microsoft Azure, distribuido geo-replicado y multi-modelo y con escalado horizontal. Una de sus principales características es el acceso garantizado menor a 10 milisegundos mediante una cantidad variada de APIs, como: SQL, MongoDB, Cassandra, Tables o Gremlin. También, tiene un percentil 99 en cualquier parte del mundo, o frece varios modelos de coherencia bien definidos para ajustar el rendimiento y calidad de los datos.

Las novedades anunciadas por Microsoft responden, en primera medida, a un pedido creciente de todos los consumidores del servicio sobre flexibilizar el modelo de facturación de Cosmos DB, en pos de equilibrar mejor la potencialidad de rendimiento con el costo del servicio. En un mundo donde no siempre tenemos los mismos requerimientos de performance en una aplicación, y todo depende del momento del día, semana o picos de tráfico, este pedido comenzó a ser crucial.

Vamos a detallar dos anuncios improtantes a este respecto: Autoscale y Serverless.

Autoscale Provisioned Throughput

Antes conocido como “Autopilot”, se puede escalar el rendimiento en función al uso / carga de trabajo dentro de un rango pre-establecido.

Su funcionamiento es simple: se establece un rendimiento máximo en términos de Request Units por segundo (RU/s). El servicio escalará las RUs según el uso, en un rango que va entre el 10% del máximo establecido y el máximo de RUs establecido. La facturación se realiza por hora, tomando el máximo de RUs utilizadas.

Autoscale puede habilitarse en bases de datos y contenedores existentes y nuevas. Y, además de poder configurarse por el portal de azure, también se puede hacer de manera programática a través de .NET y Java, ARM y comandos en las APIs de Cassandra y MongoDB. El soporte para PowerShell y Azure CLI estará pronto.

Opción Serverless

La capacidad de Autoscale es grandiosa. Pero ¿qué sucede si nuestras cargas de trabajo no requieren un rendimiento sostenido o mínimo? Es decir, que puedo tener requerimientos y picos, pero hay momentos en los que ese 10% de piso igualmente es ocioso. Estos son escenarios donde nuestras bases de datos están inactivas la mayor parte del tiempo, o al menos una gran cantidad de tiempo. En estos casos, el rendimiento pre-aprovisionado no se requiere.

Aquí es donde las capacidades de Serverless tienen sentido en Cosmos DB, y Microsoft las anunció en versión preliminar durante el Build 2020.

En estos escenarios sólo se pagará por:

  • Las Request Units (RUs) consumidas.
  • El almacenamiento consumido (en forma constante).

Sin lugar a dudas, la opción Serverless de Cosmos Db es una gran oportunidad para las personas que requieran ejecutar pequeñas aplicaciones con poco tráfico, aprovechando todas las vengajas de Cosmos DB. Se lanzará en vista previa pública en los próximos meses.

¿Qué opción elegir?

Para entender un poco más qué opción es más onveniente para nosotros, te compartimos el siguiente video y un link con una comparativa clara.

Azure Databases for PostgreSQL y MySQL

Los servicios de Microsoft Azure incluyen opciones totalmente administradas de PostgreSQL y MySQL. Hubo anuncios relevantes con respecto a las mismas que te pasamos a contar.

Para Azure Databases for PostgreSQL, se incluyen:

  • Migración online hacia Azure Database for PostgreSQL Hyperscale usando Azure Database Migration Service (disponible en forma genérica).
  • Decodificación lógica con wal2json (en preview).

Además, se anunciaron contribuciones a PostgreSQL durante el Build, que se relacionan con un parche para ciertas operaciones que resultaban en out-of-memory (OOM), y mejoras en rendimiento y características de la plataforma.

Existieron otras mejoras, tanto para PostgreSQL y MySQL, que son:

  • Autenticación con Azure Active Directory (ahora disponible públicamente).
  • Soporte para Private Link (ahora disponible públicamente).
  • Precios diferenciales para instancias reservadas a 3 años (ahora disponible públicamente).
  • Cifrado de datos via Rest con claves administradas por los clientes (escenarios de BYOK), disponibles en preview a partir de Junio.

Azure SQL Edge

Azure SQL Edge fue anunciado el año pasado en el Build 2019 con el nombre de “Azure SQL Database Edge”. Es una nversión de Azure SQL Database que puede ejecutarse en dispositivos de borde (conocidos en el mercado como “Edge Computing”), incluidos los basados con procesadores ARM. Azure SQL Edge también se integra con una versión especialmente implementada de Azure Stream Analytics.

El gran anuncio del Build 2020 fue que está, ahora, en vita previa pública, por lo cual te invitamos a experimentarla.

Azure Synapse Link

Azure Synapse Link es una extensión de Azure Synapse. Anunciado en Noviembre del año poasado, Azure Synapse Analytics es una solución que combina cómputo a demanda, almacén de datos, procesos ETL y analítica en un solo servicio.

Básicamente, Azure Synapse es la evolución de Azure SQL Data Warehouse. Combina lo mejor del concepto de Data Warehouse, Data Lake y Pipelines, ofreciendo:

  • Almacén de datos, ilimitado, con aislamiento garantizado y prioridad de cargas de trabajo.
  • Capacidades serverless.
  • Integración con PowerBI, Azure Machine Learning, Stream Analytics y Aoache Spark.
  • Enmascaramiento de datos.
  • Niveles de seguridad a nivel columna y fila.

En marco del Build 2020 Microsoft anunció la vista previa de Azure Synapse Link, una implementación nativa de Procesamiento híbrido transaccional / analítico (HTAP).

HTAP es un concepto que existe hace décadas: la idea es cambiar del análisis posterior a los datos operativos, a análisis en tiempo real contra las transacciones.

Si, como leiste: analizar los datos en tiempo real, contra las bases de datos transaccionales, sin perjudicar la performance. Y básicamente Azure Synapse Link permite eso: que los clientes obtengan información de sus origenes de datos transaccionales en tiempo real, sin administrar el movimiento de datos o poner carga en sus sistemas operativos.

Por ahora disponible para Azure Cosmos DB, y pronto para otras bases de datos de Azure y más alla de Azure.

Power BI

Power BI es la solución de análisis empresarial de Microsoft que permite visualizar los datos y compartir información con otras personas, incrustrarla en una aplicación o inclusive sitio web. Facilita conectarse a múltiples origenes de datos, modelizar y analizar los datos obtenidos, para luego presentarlos de una manera vistosa y analítica.

Power BI fue evolucionando en los últimos años, y en Build 2020 se hicieron dos anuncios destacados que te pasamos a contar aquí.

Deployment Pipelines

El uso continuo de análisis de es una actividad cada vez más crítica en las organizaciones. Esto requiere que existan, con mayor frecuencia, equipos de trabajo dedicados aesta tarea, y que entreguen más rápido y en forma continua actualizaciones, mientras se mantienen los niveles de calidad que los usuarios esperan para no perder confianza en los datos.

La administración del ciclo de vida del contenido dentro de Power BI puede ser arduo, y Microsoft anunció una mejora en Power BI Premium que facilita esto: vista previa pública de Power BI Deployment Pipelines.

Los Pipelines de despliegue de Power BI facilitan la construcción de un proceso reutilizable para mantener entornos de desarrollo, prueba y producción. De esta manera, se pueden realizar transiciones incrementales de contenido nuevo o actualizado entre entornos, minimizando errores humanos y tendiendo a la automatización.

Microsoft indicó que los clientes con Power BI Premium comenzarán a ver esta característica progresivamente en sus tenants, en las próximas semanas.

Power BI Desktop

Durante Mayo hubo muchas actualizaciones de características lanzadas en Power BI Desktop, la versión de escritorio para construir tableros e informes de calidad empresarial.

Entre las principales destacamos:

  • Novedades en Reportes.
  • Novedades en Analítica.
  • Novedades en Visualizaciones.
  • Novedades en Modelado.
  • Novedades en preparación de datos.
  • Novedades en conectores.

Las novedades son muchas, y te compartimos un enlace para que puedas verlas todas.

Azure IoT Developer Specialty Certification

Si eres desarrollador de de soluciones IoT, Microsoft anunció en el Build 2020 la disponibilidad de su curso de capacitación y certificación de Azure IoT Developer Specialty.

El curso incluye varios aspectos del trabajo de un desarrollador de IoT, como: topología del dispositivo, conectividad, depuración, seguridad, y como operarlo para garantizar el correcto funcionamiento cuando se trabaja en un espacio de tipo “Edge”.

No te pierdas la info sobre esta certificación en el siguiente enlace.

¡Feedback!

Gracias por escuchar / ver / leer esta publicación. No dejes de brindarnos feedback o compartir tus experiencias con nosotros.

[related-posts]

Sobre el Autor

[simple-author-box]

Leave a comment

Your email address will not be published. Required fields are marked *