Saltar al contenido
Etiqueta

#pytorch

8 notas publicadas

IEEE lanza programa virtual de cinco cursos sobre LLMs
Robótica

IEEE lanza programa virtual de cinco cursos sobre LLMs

Large Language Models Demystified combina arquitectura transformer, PyTorch, LoRA, RLHF y RAG en cinco módulos online con créditos de desarrollo profesional y un badge digital.

IEEE Spectrum AI
PyTorch integra Helion en vLLM para acelerar inferencia FP8
IA

PyTorch integra Helion en vLLM para acelerar inferencia FP8

La integración con vLLM aceleró normalización, cuantización fusionada y scaled_mm en H100, mientras que B200 sigue limitado por el backend GEMM de Triton sobre Blackwell.

PyTorch Blog
torch.profiler explicado: cómo leer trazas en PyTorch desde cero
IA

torch.profiler explicado: cómo leer trazas en PyTorch desde cero

Hugging Face abre una serie de tres partes sobre profiling con PyTorch, empezando por matmul más bias en bf16 sobre una NVIDIA A100 80GB.

Hugging Face
PyTorch Compile y kernel fusion: hasta 10x más rápido
IA

PyTorch Compile y kernel fusion: hasta 10x más rápido

El compilador Inductor agrupa operaciones dependientes en un solo kernel Triton, eliminando lanzamientos extra y tráfico de memoria intermedio.

PyTorch Blog
TLX Block Attention: 1,85x sobre Flash Attention v2 en NVIDIA B200
IA

TLX Block Attention: 1,85x sobre Flash Attention v2 en NVIDIA B200

El kernel Triton desarrollado por Meta para GPUs Blackwell aprovecha el patrón block-diagonal de los modelos de ranking para eliminar pasos enteros del algoritmo y acelerar 2,50x el backward pass.

PyTorch Blog
PyTorch 2.11 arregla pip install torch para GB200 y GH200
IA

PyTorch 2.11 arregla pip install torch para GB200 y GH200

El nuevo wheel CUDA para aarch64 ya viaja en el índice por defecto de PyPI, cerrando dos años de --index-url y reinstalaciones silenciosas que rompían vLLM en Grace Hopper.

PyTorch Blog
ExecuTorch MLX: PyTorch acelera en GPU de Apple Silicon
IA

ExecuTorch MLX: PyTorch acelera en GPU de Apple Silicon

El nuevo delegado MLX lleva inferencia GPU optimizada a Mac con chips de Apple, con soporte para Llama, Qwen, Gemma, Whisper y cuantización de 2 a 8 bits, además de NVFP4.

PyTorch Blog
ExecuTorch lleva PyTorch a CPUs Arm y NPUs Ethos-U
IA

ExecuTorch lleva PyTorch a CPUs Arm y NPUs Ethos-U

Arm libero una serie de Jupyter Labs que muestran como exportar un modelo PyTorch a un artefacto .pte y correrlo en Raspberry Pi 5 o Cortex-M con NPU Ethos-U.

PyTorch Blog

Etiquetas relacionadas

Otros temas que aparecen junto a #pytorch en nuestra cobertura editorial.