Skip to main content
openSUSE's Geeko chameleon's head overlayed on a cell-shaded planet Earth, rotated to show the continents of Europe and Africa

Welcome to Planet openSUSE

This is a feed aggregator that collects what the contributors to the openSUSE Project are writing on their respective blogs
To have your blog added to this aggregator, please read the instructions

a silhouette of a person's head and shoulders, used as a default avatar

#openSUSE Tumbleweed revisión de la semana 11 de 2026

Tumbleweed es una distribución de GNU/Linux «Rolling Release» o de actualización contínua. Aquí puedes estar al tanto de las últimas novedades.

Logotipo de openSUSE Tumbleweed

openSUSE Tumbleweed es la versión «rolling release» o de actualización continua de la distribución de GNU/Linux openSUSE.

Hagamos un repaso a las novedades que han llegado hasta los repositorios esta semana.

Y recuerda que puedes estar al tanto de las nuevas publicaciones de snapshots en esta web:

El anuncio original lo puedes leer en el blog de Dominique Leuenberger, publicado bajo licencia CC-by-sa, en este este enlace:

Ha sido una semana productiva y ocupada para Tumbleweed y para openQA en particular. Se han mandado a probar un total de 7 snapshots y 6 fueron confirmadas y publicadas (0305, 0306, 0307, ​​0308, 0310 y 0311).

La snapshot 0309 fue la primera en incluir systemd 259.3 y openQA no estaba nada contento. El culpable resultó ser una falta de sincronización con las políticas de SELinux. Una vez que se actualizaron las políticas en la snapshot 0310, openQA quedó (en su mayor parte) satisfecho.

Las actualizaciones más destacadas de esta semana:

  • bind 9.20.20
  • gstreamer 1.28.1
  • iptables 1.8.13
  • shadow 4.19.4
  • PackageKit 1.3.4
  • KDE Gear 25.12.3
  • Linux kernel 6.19.6
  • libvirt 12.1.0
  • GCC 16 proporciona las bibliotecas base, como libgcc_s1. El compilador del sistema sigue siendo la versión 15 por el momento.
  • Pipewire 1.6.1
  • systemd 259.3
  • Mozilla Firefox 148.0.2
  • postfix 3.11.1

Y para próximas snapshots, ya se están preparando las siguientes actualizaciones:

  • Mesa 26.0.2
  • cURL 8.19.0
  • systemd 259.4
  • GCC 16 como compilador predeterminado
  • Cambiar el bootloader predeterminado en sistemas uefi a systemd-boot
  • glibc 2.43
  • GNOME 50

Si quieres estar a la última con software actualizado y probado utiliza openSUSE Tumbleweed la opción rolling release de la distribución de GNU/Linux openSUSE.

Mantente actualizado y ya sabes: Have a lot of fun!!

Enlaces de interés

——————————–

a silhouette of a person's head and shoulders, used as a default avatar

Tumbleweed – Review of the week 2026/11

Dear Tumbleweed users and hackers,

It’s been a productive and busy week for Tumbleweed—and for openQA in particular. We threw 7 snapshots at the engines, and 6 were confirmed and published (0305, 0306, 0307, 0308, 0310, and 0311).

Snapshot 0309 was the first to include systemd 259.3, and openQA was not happy at all. The culprit turned out to be a missing sync with the SELinux policies. Once the policies were updated in snapshot 0310, openQA was (mostly) satisfied. A few additional policy tweaks were pushed via the update channel to ensure we didn’t block the snapshot pipeline any longer than necessary.

Those 6 snapshots brought you these changes:

  • bind 9.20.20
  • gstreamer 1.28.1
  • iptables 1.8.13
  • shadow 4.19.4
  • PackageKit 1.3.4
  • KDE Gear 25.12.3
  • Linux kernel 6.19.6 & kernel longterm 6.18.16
  • libvirt 12.1.0
  • GCC 16 is providing the base libraries, such as libgcc_s1. The system compiler is still version 15 for the time being
  • Pipewire 1.6.1
  • systemd 259.3
  • Mozilla Firefox 148.0.2
  • postfix 3.11.1

The future holds these changes, once they pass QA:

  • Mesa 26.0.2
  • cURL 8.19.0
  • systemd 259.4
  • Switch default bootloader on uefi systems to systemd-boot (aligning tumbleweed to microos)
  • GCC 16 as the default compiler
  • GNOME 50: RC is staged for QA; release planned by upstream for March 18
  • glibc 2.43: metabug: https://bugzilla.opensuse.org/show_bug.cgi?id=1257250
a silhouette of a person's head and shoulders, used as a default avatar

Lanzado Glaxnimate 0.6, el editor de gráficos vectoriales en 2D para la creación de animaciones

Me complace compartir con vosotros que ha sido lanzado Glaxnimate 0.6, el editor de gráficos vectoriales en 2D de la Comunidad KDE específicamente pensado para la creación de animaciones. Un complemento ideal para Kdenlive y Krita que dota de más herramientas para artistas digitales y que éstos se sientan como en casa en el ecosistema KDE.

Lanzado Glaxnimate 0.6, el editor de gráficos vectoriales en 2D para la creación de animaciones

Creo que no ha sido presentado formalmente en el blog, así que espero que le deis la bienvenida a la familia de aplicaciones KDE a Glaxnimate, un editor de gráficos vectoriales en 2D diseñado específicamente para la creación de animaciones.

Hay que destacar que Glaxnimate es un proyecto independiente pero forma parte del ecosistema de KDE y se ha convertido en el compañero ideal para editores de vídeo como Kdenlive.

Lanzado Glaxnimate 0.6, el editor de gráficos vectoriales en 2D para la creación de animaciones

A diferencia de herramientas como Inkscape (que se centra en dibujo estático), Glaxnimate está optimizado para que los elementos se muevan, cambien de forma o sigan trayectorias a lo largo del tiempo.

En el anuncio del 3 de marzo de este año, los desarrolladores de Glaxnimate comunicaron que:

«¡Ya está disponible Glaxnimate 0.6.0! Este es el primer lanzamiento estable de Glaxnimate como parte integrante de KDE.

El mayor beneficio de unirse a KDE es que ahora Glaxnimate puede utilizar la infraestructura de KDE para compilar y distribuir paquetes, mejorando enormemente el soporte multiplataforma. Esto nos permite tener versiones disponibles en la Microsoft Store y builds para macOS, tanto para procesadores Intel como para chips Arm.»

Como vemos, un lanzamiento que pone un punto y aparte en el desarrollo de la aplicación ya que con la integración gana cosas como:

  • Utilización del sistema de recuperación de archivos de KDE, lo que lo hace más fiable.
  • La configuración y los estilos también pasan a través de los sistemas de KDE, lo que, entre otras cosas, permite elegir entre más temas de color para la interfaz.
  • Las traducciones también son proporcionadas por KDE. Esto facilita mantener otros idiomas al día a medida que Glaxnimate evoluciona. De hecho, ¡el número de idiomas disponibles ha aumentado de 8 a 26!»

Pero además, este lanzamiento nos ofrece jugosas nuevas características:

  • Mejoras en el acoplador de la línea de tiempo,que ahora permite desplazarse sin esfuerzo y proporciona botones que facilitan moverse a diferentes fotogrames clave; además, añadirlos y eliminarlos también es más sencillo.
  • Posibilidad de deshacer y reahacer ocultar y mostrar capas desde la línea de tiempo, lo cual mejora la eficiencia.
  • Conmutación rápida de la graduación (interpolación) de los fotogramas clave sin tener que navegar por los menús, simplemente mantén presionada la tecla Alt y haz clic en la línea de tiempo.»
  • Mejorada la importación y exportación de SVG, en concreto se ha hecho desde cero y las precomposiciones ahora se exportan correctamente y se han mejorado las animaciones. Incluso puedes exportar una animación como una secuencia de fotogramas SVG.
  • Mejoras en la edición, como la optimizado las herramientas de edición de Bézier, y se ha incluido la capacidad de hacer clic con Alt sobre los puntos de Bézier para rotar entre los modos de simetría de tangente. Ahora se ha implementado la acción Invertir trazado (Reverteix el camí) y funciona con todas las formas. Esto es útil principalmente al añadir el modificador de Trazado de recorte (Clip Path).

Como vemos, un lanzamiento muy especial para una aplicación que por si sola ya es interesante pero que combinada con otras puede ser definitiva para atraer artistas digitales.

La entrada Lanzado Glaxnimate 0.6, el editor de gráficos vectoriales en 2D para la creación de animaciones se publicó primero en KDE Blog.

the avatar of openSUSE News

Planet News Roundup

This is a roundup of articles from the openSUSE community listed on planet.opensuse.org.

The community blog feed aggregator lists the featured highlights below from March 6 to March 12.

Blogs this week highlight digiKam 9.0’s new Survey tool for rapid photo comparison, IBM’s compact speech AI for edge deployment, FreeBSD installation on the HP Z2 Mini, Plasma 6.5’s sixth bugfix update, and FDE improvements dropping legacy pcr-oracle support. Blogs also cover reasons for using Tumbleweed’s Thunderbird release, Rocky Linux joining KDE as a sponsor, the Lenovo ThinkBook Modular AI PC concept, OBS’ post-mortem analysis on a stuck jobs queue, syslog-ng 4.11.0 release notes, and more.

Here is a summary and links for each post:

Thunderbird Always Updated from openSUSE Tumbleweed Repositories

Victorhck explains how openSUSE Tumbleweed users benefit from receiving official Mozilla Thunderbird releases directly through the distribution’s rolling update channel without relying on Flatpak or third-party repositories. The post details how Tumbleweed’s rapid packaging pipeline ensures users get security patches and new features within hours of upstream releases.

Launched digiKam 9.0, introducing the new Survey tool

The KDE Blog announces the release of image organizer and tag editor digiKam 9.0. The new major version has a migration to Qt 6.10.1 for higher speed and stability for Wayland Linux users. The blog points out RAW support updates for Canon EOS R1, Nikon Z6-III, Sony A9-III and more. There is also support for batch coordinate editing and a new home screen design.

Granite 4.0 1B Speech: Compact voice AI for the edge

Alessandro’s Blog provides information about IBM’s new Granite 4.0 1B. The model, under the Apache 2.0 license, explains the capabilities of automatic speech recognition (ASR) and automatic speech translation (AST) across six languages. The ASR covers English, French, German, Spanish, Portuguese, and Japanese while the two-way AST pairs these languages and English. It also has additional pairs such as English–Italian and English–Mandarin in speech-to-text-to-text scenarios. Granite 4.0 1B Speech is available on Hugging Face.

The syslog-ng Insider 2026-03: 4.11.0 release; OpenSearch; ElasticSearch

Peter Czánik’s Blog links the March syslog-ng community newsletter covering version 4.11.0 availability. The newsletter covers OpenSearch data streams and changes to the Elasticsearch destination. The full newsletter is available at the syslog-ng community blog.

Dropping pcr-oracle in user space Full Disk Encryption

The openSUSE News site informs users of the deprecation of pcr-oracle in user space Full Disk Encryption (FDE) for those openSUSE systems using Trusted Platform Module 2 (TPM2). The shift moves from signed policy with JSON files stored in the EFI System Partition to systemd-pcrlock, which stores policy in TPM2 non-volatile RAM under a password (recovery PIN). The change resolves rollback attack vulnerabilities inherent to signed policies and simplifies maintenance across multiple boot loaders.

Sixth Plasma 6.5 update

The KDE Blog announces the sixth bugfix update for Plasma 6.5. The update continues KDE’s regular maintenance cycle and highlights novelties like automatic light/dark theme switching, new initial setup wizard (KISS), global WiFi password storage, KWin performance improvements and more.

Lenovo Thinkbook Modular Dual Screen Laptop | Blathering

The CubicleNate Blog examines Lenovo’s ThinkBook Modular AI PC concept unveiled at Mobile World Congress 2026. The machine is a 14-inch ultra-thin laptop with a detachable secondary display. Nate covers the pros and cons while expressing concern over the proprietary components.

New toy: Installing FreeBSD on the HP Z2 Mini

Peter Czánik’s Blog continues to update readers on his new toy and the installation of FreeBSD 15.0 installation on the AMD Ryzen AI Max+ PRO 395-powered workstation. The installation proceeded smoothly, and the system runs at exceptional speeds even when compiling software from FreeBSD ports with minimal noise. FreeBSD boots only via EFI menu boot from file option since standard boot managers don’t recognize it.

Rocky Linux becomes a sponsor of KDE

The KDE Blog announces Rocky Linux as a new KDE patron organization. Congratulations to both. Rocky Linux joins recent sponsors Kubuntu Focus, g10 Code, and Techpaladin alongside longer-standing backers like The Qt Company, SUSE, Google, Blue Systems, Slimbook, Pine64 and more.

Post-mortem: Stuck Critical Jobs Queue

The Open Build Service Blog publishes a post-mortem analysis of service degradation between March 4–5. Users experienced inability to retrieve diff changes for submit requests. Multiple code change factors contributed to the stuck critical jobs queue.

OWASP SP offers ModSecurity (CRS) for openSUSE.

Alessandro’s Blog reports that OWASP São Paulo chapter released ModSecurity Core Rule Set (CRS) version 4.24.1. CRS is a ruleset for Web Application Firewalls that provides generic detection rules to protect web applications against common attacks. This incremental update focuses on stability improvements, enhanced attack detection, and reduced false positives, and makes it essential for systems using ModSecurity or compatible WAF engines to stay protected against emerging threats.

Much Progress in Marknote and Drawy – This Week in KDE Apps

The KDE Blog highlights significant developments across KDE applications, with Marknote reaching version 1.4.0 featuring undo/redo for sketches, drag-and-drop notes between notebooks and more. Drawy received a major overhaul with a new interface, improved zoom controls, and a plugin system for tools.

Updating perltidy (and other dependencies) in os-autoinst

The openQA bites post short blurb explains that when updating dependencies in the dependencies.yaml file in os-autoinst that it will update cpanfile for the user.

Linux Saloon 191 – Application Managers

The CubicleNate Blog covers a lively discussion from the Linux Saloon podcast. Participants shared their impressions about topics like Android sideloading and the evolution of software distribution methods in the Linux ecosystem.

3 Native Racing Games for Linux

The KDE Blog showcases three demanding native Linux racing games. Speed Dreams offers a realistic racing simulator with diverse vehicles and multiple game modes. Trigger Rally provides arcade-focused fun with more than 100 maps across varied terrain. Stunt Rally rounds out the selection with the most complex and creative experience and features more than 200 tracks across 37 scenarios..

openSUSE Tumbleweed Weekly Review – Week 10 of 2026

Victorhck and dimstar report on the snapshots delivered in week 10. The review covers a minor selinux-policy update that inadvertently exposed code relying on incorrect previous behavior, causing boot failures detected by openQA before reaching users. Other updates include Python 3.14, KDE Plasma 6.6.1 and 6.6.2, Linux kernel 6.19.5, and more. Upcoming changes include the GNOME 50 release candidate, glibc 2.43, and a switch to systemd-boot as the default UEFI bootloader, which will align Tumbleweed to MicroOS standards.

Third Update of KDE Gear 25.12

The KDE Blog highlights the third maintenance release of KDE Gear 25.12. The update has corrections to KDE Connect plugin toggling, NeoChat message behavior, an Umbrello crash and more.

Seeing people through the walls with Wi-Fi – π RuView: WiFi DensePose

Watch on Vimeo

Alessandro’s Blog looks at RuView, which is an open-source privacy-first system that analyzes Wi-Fi signal disturbances (CSI data) to reconstruct human pose, detect respiration and heart rates, and sense presence through walls without any cameras. Applications range from elderly fall detection and perimeter security to industrial monitoring, and more.

View more blogs or learn to publish your own on planet.opensuse.org.

a silhouette of a person's head and shoulders, used as a default avatar

Thunderbird siempre actualizado desde los repositorios de openSUSE Tumbleweed

Cómo sustituir la versión ESR de Mozilla Thunderbird por la de actualizaciones mensuales directamente desde los repositorios de openSUSE Tumbleweed y mantener tu cliente de correo siempre al día

Logotipo de Thunderbird. Un pájaro de color azul enroscado alrededor de un sobre de correos y el nombre de la aplicación

La distribución de GNU/Linux openSUSE Tumbleweed es una distribución «rolling release», es decir, de actualización contínua donde sus paquetes de software se van actualizando a las versiones más nuevas, pero que antes de llegar a los repositorios son testeadas para probar que todo funciona correctamente y sin sobresaltos.

El resultado es una distribución siempre actualizada y estable. Una verdadera joya poco conocida y poco valorada en el ecosistema de GNU/Linux (o esa es mi apreciación).

Todos los paquetes estaban actualizados ¿Todos?, no. En mi caso el cliente de correo Mozilla Thunderbird se mantenía en la versión de soporte extendido (o ESR), por lo que no podía estar a la última ahora que Thunderbird ha decidido realizar actualizaciones más contínuas.

Ya escribí en un artículo anterior, cómo sustituir nuestra versión de Thunderbird ESR por la versión de binarios actualizados ofrecidos por Thunderbird.

Pero yo prefiero utilizar los repositorios propios de openSUSE, donde se encuentra el software empaquetado por colaboradores para usarlo directamente en nuestro sistema.

Así que he cambiado mi versión de Thunderbird ESR por la versión más actualizada que reside en los repositorios y que se va actualizando cada mes. Ten en cuenta que si utilizas algún complemento, este puede no funcionar correctamente o directamente no funcionar en las nuevas versiones hasta que lo actualicen.

Veamos los pasos que he seguido para cambiar de Thunderbird ESR a la versión que se va actualizando cada mes.

Backup de las configuraciones

Lo primero vamos a crear un backup de lo que tenemos ahora por si acaso… En mi proceso no he tenido ningún problema, pero mejor guardarse las espaldas. Creamos una copia de nuestra configuración, firmas, claver PGP, etc mediante:

cp -r ~/.thunderbird ~/.thunderbird-backup  

Dentro de la carpeta oculta .thunderbird se guardan los datos de nuestras configuraciones, y lo que haremos será crear una copia.

Añadir el repositorio de Mozilla

En mi caso ya lo tenía añadido, pero si no es tu caso, para añadir ese repositorio lo podemos hacer mediante YaST/Mrlyn o mediante la terminal con el comando:

sudo zypper ar -f https://download.opensuse.org/repositories/mozilla/openSUSE_Tumbleweed/mozilla.repo                   

Instalar Thunderbird desde el nuevo repositorio

Ahora ya solo falta actualizar Thunderbird y decirle a zypper que lo haga desde el nuevo repositorio que hemos añadido:

sudo zypper install --from mozilla MozillaThunderbird

Si ya teníamos Thunderbird instalado nos dirá que hay conflictos y que qué queremos hacer. Le decimos que lo instale con cambio de proveedor, es decir, que instale la nueva versión desde el nuevo repositorio que le hemos indicado.

Et voila!

Terminado el proceso ya deberíamos tener todo listo y preparado para abrir nuestro Thunderbird actualizado a la última versión (la 148 a la hora de escribir este artículo). Puedes ejecutar un: sudo zypper install --from mozilla MozillaThunderbird para ver información del nuevo paquete de software.

En mi caso todo ha ido sin problemas. Se mantienen mis contactos, firmas, claves GPG, configuración de carpetas y los pocos complementos que utilizo funcionan correctamente, así que todo genial.

He tenido que volver a añadir el icono a mis favoritos en el lanzador de aplicaciones y volver a crear un atajo de teclado para lanzar el programa porque habían desaparecido, pero nada más.

Ya el cliente de correo Thunderbird se mantendrá actualizado a las nuevas versiones, estándo en consonancia con todo mi sistema que siempre se mantiene a la última y estable. ¿Te animas a probarlo tu también?

Back to the future

Si quisiéramos regresar a la versión antigua porque algo ha salido mal o no nos convence. Eliminamos el repositorio que hemos añadido, eliminamos el paquete de software y sus dependencias. Y volveríamos a instalar el Thunderbird ESR y volveríamos a utilizar el backup de las configuraciones anteriores de la que hicimos una copia.

Fichas del juego Scrabble formando la palabra email
a silhouette of a person's head and shoulders, used as a default avatar

Lanzado digiKam 9.0, presentando la nueva herramienta Survey

Que una aplicación sea excepcional no significa que su desarrollo haya finalizado. El mejor gestor de imágenes de la Comunidad KDE (y una de las mejores del mercado tanto libre como privado) sigue su desarrollo. De esta forma ha sido lanzado digiKam 9, una nueva versión que incluye muchas novedades en el algoritmo de reconocimiento de caras.

Lanzado digiKam 9.0, presentando la nueva herramienta Survey

Lanzado digiKam 8.0, con mejoras en la documentación y más formatos soportados

El pasado 8 de marzo fue lanzado digiKam 9.0, la nueva versión de uno de los gestores de imágenes más completo que puedes encontrar en el mundo GNU/Linux, e incluso en el mundo privativo.

Este nuevo digiKam ha recibido un intenso trabajo en muchas de sus facetas, no en vano han pasado más de dos años de desarrollo donde se han ido puliendo aspectos que estaban descuidados, que simplemente se habían quedado obsoletos o que deben adaptarse a los tiempos en los que vivimos.

Sus novedades principales son:

  • Migración total a Qt 6.10.1, lo que se traduce en mayor velocidad, seguridad y mejor estabilidad en Windows 11 y Linux (Wayland).
  • Más soporte RAW: Actualización de Libraw para soportar las cámaras más recientes (Canon EOS R1, Nikon Z6-III, Sony A9-III, entre otras).
  • Nuevo Modo «Survey» (Sondeo): Una ventana independiente (ideal para doble monitor) para comparar y clasificar fotos rápidamente con herramientas de zoom y etiquetado.
  • Búsqueda Avanzada: Ahora permite localizar archivos con campos de metadatos vacíos o editados recientemente.
  • Soporte para edición de coordenadas en lote, es decir, a múltiples imágenes a la vez.
  • Posibilidad de cambiar el formato de fecha (incluyendo segundos) y renombrar las etiquetas de colores.
  • Nueva Pantalla de inicio, rediseñada desde cero para ser más fluida.
  • Se añade una lupa, indicadores de sobre/subexposición y soporte para gestos en el trackpad.
  • Mayor claridad en diversas secciones: pestañas de filtrado divididas en Propiedades, Etiquetas y Personas para mayor claridad.
  • Posibilidad de personalizar los nombres de las etiquetas de color desde la propia barra de etiquetas.
Lanzado digiKam 9.0, presentando la nueva herramienta Survey

Más información: digiKam

¿Qué es digiKam?

La mejor forma de definir digiKam es buscar como se describe esta aplicación de userbase.kde.org y realizar una pequeña síntesis:

«DigiKam es una aplicación que te permite la importación de fotografías desde  cámaras, creación de álbumes, etiquetado con fechas, temas y otras propiedades, utilidades de búsqueda excelentes y modificación de imágenes en masa.»

La entrada Lanzado digiKam 9.0, presentando la nueva herramienta Survey se publicó primero en KDE Blog.

the avatar of Alessandro de Oliveira Faria

Granite 4.0 1B Speech: IA de voz compacta para o edge

Visão geral

Granite 4.0 1B Speech é o novo modelo de fala aberto da família Granite, da IBM, voltado para reconhecimento automatico de fala (ASR) e tradução automática de fala (AST) em múltiplos idiomas. Com cerca de 1 bilhão de parâmetros, ele foi desenhado para rodar em dispositivos com recursos limitados, mantendo desempenho competitivo frente a modelos bem maiores, inclusive em benchmarks públicos como o OpenASR.
O modelo é distribuído com pesos abertos, sob licença Apache 2.0, e já está integrado ao ecossistema de ferramentas como Hugging Face Transformers e vLLM, facilitando a adoção por desenvolvedores e empresas.

Principais capacidades

Granite 4.0 1B Speech é um modelo de linguagem de fala (“speech-language model”) capaz de:

  • Reconhecimento automático de fala (ASR) em seis idiomas: inglês, francês, alemão, espanhol, português e japonês.
  • Tradução automática de fala (AST) bidirecional entre esses idiomas e o inglês, além de pares adicionais como inglês–italiano e inglês–mandarim em cenário de fala-para-texto-para-texto.
  • Processamento de entradas apenas de texto, reaproveitando o backbone Granite 4.0 1B como um modelo de linguagem tradicional quando não há áudio.

Além disso, a versão 4.0 introduz dois recursos bastante pedidos pela comunidade: suporte completo a ASR em japonês e “keyword list biasing”, que permite enviesar a decodificação para reconhecer melhor nomes próprios, siglas e termos específicos de domínio.

O que muda em relação ao Granite Speech 3.3

Granite 4.0 1B Speech sucede a linha Granite Speech 3.3, que incluía variantes de 2B e 8B parâmetros focadas principalmente em ASR em inglês e AST para alguns idiomas europeus e asiáticos. Enquanto o Granite Speech 3.3 8B já superava modelos abertos e fechados em tarefas de transcrição em inglês, ele exigia mais memória e poder computacional, o que limitava usos em cenários de edge ou dispositivos embarcados.

Na nova geração, a IBM reduz o número de parâmetros pela metade em relação ao granite-speech-3.3-2b, mantendo ou melhorando a acurácia em inglês e ampliando o suporte multilíngue. Isso é viabilizado por melhorias na arquitetura, na estratégia de alinhamento entre áudio e texto e no uso de técnicas de inferência como speculative decoding, que aceleram significativamente o tempo de resposta.

Arquitetura em alto nível

Granite 4.0 1B Speech segue a linha dos modelos Granite Speech anteriores: um encoder acústico especializado é acoplado a um modelo de linguagem de propósito geral (Granite 4.0 1B Base), alinhado para operar sobre embeddings de fala.

No encoder de áudio, a IBM utiliza 16 blocos Conformer treinados com CTC (Connectionist Temporal Classification) sobre um vocabulário de caracteres ASCII para idiomas europeus e um conjunto fonético de Katakana para japonês.​ Esse encoder incorpora block-attention com janelas de 4 segundos e self-conditioned CTC, reduzindo o custo computacional e melhorando a robustez em áudios longos.

Entre o encoder de fala e o LLM, há um adaptador de modalidade baseado em Windowed Query Transformer (Q-Former), responsável por reduzir a sequência temporal e projetar os embeddings acústicos para o espaço de embeddings de texto do Granite 4.0. O modelo de linguagem em si herda o backbone Granite 4.0 1B, que usa uma arquitetura híbrida Mamba‑2/Transformer, com foco em eficiência de memória e latência, além de oferecer contexto longo (até 128k tokens) em algumas variantes.

Desempenho em benchmarks

Apesar do tamanho relativamente pequeno, Granite 4.0 1B Speech alcançou a primeira posição no OpenASR Leaderboard, com word error rate (WER) médio em torno de 5,5%, superando modelos como Whisper Large V3, Phi-4 Multimodal e Canary 1B Flash. Esses resultados mostram que é possível combinar compacidade com alta qualidade de transcrição, algo especialmente relevante para aplicações em produção com custos de infra estrita.

Nos benchmarks de ASR em inglês, o modelo atinge WER competitivo ou superior em relação a sistemas com muito mais parâmetros, mantendo boa performance também em cenários multilíngues. Em AST, o modelo acompanha ou se aproxima de modelos maiores nos pares de idioma suportados, com destaque para traduções inglês–europeu e inglês–japonês/chinês.

Licença, governança e segurança

Assim como os demais modelos Granite 4.0, o 1B Speech é liberado sob licença Apache 2.0, o que permite uso comercial, modificações e redistribuição, desde que mantidos os avisos de copyright e licença. A IBM destaca que os modelos compactos seguem o mesmo padrão de governança, rastreabilidade de dados e certificações (incluindo conformidade com ISO 42001) adotado na família Granite maior.

Para deployments em produção, a recomendação é integrar o modelo com o Granite Guardian, camada de segurança e detecção de riscos que ajuda a mitigar abusos, vazamento de dados sensíveis e outros comportamentos indesejados. Isso é especialmente relevante em cenários regulados, como saúde, finanças e setor público, em que logs de áudio e transcrições podem conter informações altamente sensíveis.

Casos de uso típicos

Granite 4.0 1B Speech é particularmente atrativo para cenários de edge e aplicações empresariais que precisam de processamento de fala local.
Alguns exemplos de uso incluem:

  • Contact centers e voicebots corporativos, com reconhecimento de fala em tempo real em múltiplos idiomas e opção de tradução on-the-fly para agentes humanos.
  • Sistemas embarcados em veículos, equipamentos industriais ou dispositivos IoT, onde a comunicação por voz precisa funcionar mesmo com conectividade limitada.
  • Ferramentas de produtividade, como assistentes pessoais, sistemas de tomada de notas em reuniões e legendagem automática, com possibilidade de rodar localmente em notebooks potentes ou estações de trabalho.
  • Aplicações multilíngues em ambientes regulados, que exigem maior controle sobre dados de áudio e transcrições, evitando o envio de informações para serviços externos proprietários.

No contexto de desenvolvimento de agentes e pipelines RAG, o modelo também pode atuar como front-end de voz para um LLM de texto maior, convertendo áudio em texto que depois será enriquecido com contexto externo e respondido de volta ao usuário, possivelmente com síntese de voz em outro componente.

Como experimentar o modelo

O Granite 4.0 1B Speech está disponível no Hugging Face sob o identificador ibm-granite/granite-4.0-1b-speech, com documentação detalhada, exemplos de uso e instruções de inferência via Transformers e vLLM.
Um exemplo simplificado de uso com vLLM demonstra como carregar o modelo, aplicar o template de chat e enviar um áudio junto com a instrução para obter a transcrição:

from transformers import AutoTokenizer
from vllm import LLM, SamplingParams
from vllm.assets.audio import AudioAsset
model_id = "ibm-granite/granite-4.0-1b-speech"
tokenizer = AutoTokenizer.from_pretrained(model_id)
def get_prompt(question: str, has_audio: bool):
if has_audio:
question = f"<|audio|>{question}"
chat = [{"role": "user", "content": question}]
return tokenizer.apply_chat_template(chat, tokenize=False)
model = LLM(
model=model_id,
max_model_len=2048,
limit_mm_per_prompt={"audio": 1},
)
question = "can you transcribe the speech into a written format?"
prompt_with_audio = get_prompt(question=question, has_audio=True)
audio = AudioAsset("mary_had_lamb").audio_and_sample_rate
inputs = {"prompt": prompt_with_audio, "multi_modal_data": {"audio": audio}}
outputs = model.generate(
inputs,
sampling_params=SamplingParams(temperature=0.2, max_tokens=64),
)
print(outputs[0].outputs[0].text)

Além da integração com vLLM, o modelo pode ser consumido via API ou contêineres preparados por parceiros e pela própria IBM, seguindo a mesma lógica de outros modelos Granite 4.0.

Por que o Granite 4.0 1B Speech é relevante

A combinação de abertura de pesos, licença permissiva, eficiência computacional e desempenho de ponta em benchmarks públicos torna o Granite 4.0 1B Speech um candidato natural para empresas que querem construir soluções de voz sem ficarem presas a serviços proprietários. O fato de o modelo liderar rankings como o OpenASR, mesmo com apenas 1 bilhão de parâmetros, mostra que há espaço para arquiteturas mais enxutas competirem com gigantes em tarefas de ASR e AST.

Para times de engenharia, isso se traduz em custos menores de GPU/CPU, possibilidade de deployment on-premises ou no edge e mais controle sobre toda a cadeia de dados de áudio.
Para a comunidade, é mais um passo na direção de um ecossistema de IA de voz verdadeiramente aberto, no qual modelos de fala de alta qualidade podem ser auditados, adaptados e combinados com outras peças (TTS, LLMs de texto, agentes) sem barreiras artificiais.

Até o próximo post.

a silhouette of a person's head and shoulders, used as a default avatar
the avatar of openSUSE News

Dropping pcr-oracle in user space Full Disk Encryption

Introduction

In user space Full Disk Encryption (FDE), as opposed to the boot loader based FDE, developers for openSUSE supported signed policy and NVIndex policy from the beginning when Trusted Platform Module 2 (TPM2) is used.

With this signed policy, we deliver a JSON file in the EFI System Partition (ESP) that is being read during the initrd stage by systemd-cryptsetup. This file contains the hash policy, which basically describes the expected values of the PCR registers of the TPM2 (measured boot). Together with the policy, we will find a signature that will be validated by the TPM2, and if the PCR values and the signatures are valid, then the TPM2 will unseal the password for the encrypted hard disk, and the boot process can continue.

This method is simple and very flexible. We can update the policy to generate new predictions (for example if a new kernel was installed). Using a private key, that can be stored in the encrypted side of the system, we can sign it and install in the ESP. Another advantage is that we can generate multiple files that support multiple valid configurations, which can represent different snapshots, kernels, or initrd installed in the system.

But one limitation of this method is that we are not protected against a rollback attack. Some one can copy the JSON file (the ESP is not encrypted), together with the kernel and the initrd and wait until some CVE is published for this configuration. After that, the assets can be copied back to the ESP and the signature of the policy will be still valid as far as the TPM2 is concerned. Technically, this can be resolved generating a new private key and enrolling again the devices, but this is not ideal.

systemd-pcrlock provides a new alternative, known as NVIndex policy, which store the policy in the TPM2 non-volatile RAM under a password (recovery PIN). This approach is a bit better for our case, as it resolves the rollback attack. This method is used by default if the TPM2 support it, but because policyAuthorizeNV was introduced in TPM2 Revision 1.38 ten years ago (2016), not all devices can do that. sdbootutil fallbacks to pcr-oracle (signed policy) if NVIndex policy cannot be used.

The next version of sdbootutil will drop pcr-oracle.

Motivation

Basically it is time to do that. The rollback attack is a good argument to avoid signed policies, but we need to factor the maintenance of pcr-oracle for multiple boot loaders (GRUB2 and systemd-boot).

The way that pcr-oracle works means that any change in the event log order or structure needs to be addressed in the source code, but with systemd-pcrlock it is a matter of generating some JSON files stored in /var/lib/pcrlock.d and updating the TPM2 policy in the right moment.

This difference makes pcr-oracle stay behind in the current support, making in effectively broken for any metric.

Migration

The good news is that if you have a TPM2 produced after 2016, you can migrate to systemd-pcrlock very easily. sdbootutil still recognize systems registered with pcr-oracle and can unenroll them. The migration process is as easy as:

  # sdbootutil unenroll --method=tpm2
  #  sdbootutil enroll --ask-pin --method=tpm2

If sadly your TPM2 revision is older, the password enrollment is always available:

  # sdbootutil unenroll --method=tpm2
  #  sdbootutil enroll --method=password

Further Documentation

a silhouette of a person's head and shoulders, used as a default avatar

Sexta actualización de Plasma 6.5

Me alegra compartir con todos vosotros la sexta actualización de Plasma 6.5, siguiendo así una serie de revisión de software que ha dotado de más estabilidad, mejores traducción y resolución de errores este entorno de trabajo. Estas actualizaciones son 100% recomendables y casi obligatorias para cualquier usuario ya que lo único que hacen es mejorar la versión sin comprometer sus funcionalidades.

Sexta actualización de Plasma 6.5

No existe Software creado por la humanidad que no contenga errores. Es un hecho incontestable y cuya única solución son las actualizaciones. Es por ello que en el ciclo de desarrollo del software creado por la Comunidad KDE se incluye siempre las fechas de las mismas siguiendo una especie de serie de Fibonacci.

Así que me congratula en presentar que ayer martes 10 de marzo de 2026, varios meses después de liberar el código de Plasma 6.5 , la Comunidad KDE presenta su sexta actualización de errores, con lo que se convierte en estos momentos en el amalgama de escritorio estable y más estable que puedes tener en tu ordenador.

Sexta actualización de Plasma 6.5

Más información: KDE

Las novedades generales de Plasma 6.5

Aprovecho para realizar un listado de las novedades generales de Plasma 6.5:

Icono del sitio
  • Cambio automático entre tema claro y oscuro
  • Paneles desplazables para widgets y accesos
  • Nuevo asistente de configuración inicial (KISS)
  • Almacenamiento global de contraseñas Wi-Fi
  • Mejoras de rendimiento en KWin al reproducir vídeo
  • Configuración de diales en tabletas de dibujo
  • Mejoras en la gestión de colores para monitores HDR
  • Uso de la tecla Enter en las acciones de apagado del menú Kickoff
  • Filtro de accesibilidad para escala de grises
  • Ajustes visuales con bordes redondeados en menús

Más información: KDE

La entrada Sexta actualización de Plasma 6.5 se publicó primero en KDE Blog.