Etiqueta

#rlhf

3 notas publicadas

OpenAI: el RL con rasgos virtuosos blinda a los modelos en 44 benchmarks

Una pequeña fracción de datos con rasgos como veracidad, humildad epistémica y corregibilidad mejoró 44 de 53 evaluaciones independientes de honestidad, sicofancia y reward hacking.

The Decoder21 jun

Robótica

IEEE lanza programa virtual de cinco cursos sobre LLMs

Large Language Models Demystified combina arquitectura transformer, PyTorch, LoRA, RLHF y RAG en cinco módulos online con créditos de desarrollo profesional y un badge digital.

IEEE Spectrum AI20 jun

Por qué ChatGPT se obsesionó con goblins, según OpenAI

Las menciones de 'goblin' subieron 175% tras el lanzamiento de GPT-5.1, y el equipo trazó el problema a un reward signal mal calibrado en la personalidad Nerdy.

The Decoder4 may

Etiquetas relacionadas

Otros temas que aparecen junto a #rlhf en nuestra cobertura editorial.

#Openai2 #LLM2 #Chatgpt1 #GPT-51 #alignment-ia1 #reward-hacking1 #ieee1 #pytorch1