Crónica

El entrenador de Gemini


Es lo que AI

Entrenar a una Inteligencia Artificial parecía el paraíso freelancer: flexibilidad horaria y pago en dólares. Luego de varias capacitaciones, Martín Mazzini empezó a clasificar prompts. Evaluó millones, línea por línea, si eran precisos, incorrectos, en debate o no verificables. Una noche, incluso, los vio alucinar. ¿Cómo se educa a una IA? Promesas, incentivos, penalizaciones y precariedad en una industria por la que, solo en español, circulan más de diez mil empleados.

Ustedes que entran/
Abandonen toda esperanza.

Dante, La Divina Comedia

El verano pasado vi una búsqueda de empleo en Linkedin para entrenar IA. A cambio de saber escribir en inglés, prometía el paraíso del freelancer: trabajo desde casa en horarios elegidos por mí y pago en dólares. Me postulé y me llegó un mail. Me pidieron que filmara tres videos de presentación. Uno preguntaba por mis rituales. Hablé de cómo me gusta tomar mate. 

En tres días me aceptaron, creé una cuenta en La Plataforma de Trabajo Remoto y otra en PayPal para cobrar. Y empezaron las capacitaciones: chorradas de documentos compartidos en Google Drive explicando las tareas que íbamos a hacer, videos y pruebitas con multiple choice: las aprobaba todas. Me sumaron a varios canales de Slack, una plataforma de mensajes para trabajar en equipos. 

Lo primero que vi en Slack fue una serie de mensajes exactamente iguales: varios colaboradores repetían “esta es mi cuenta, solicito tareas”. No los copié. Un mes más tarde, me llegaban mails diciendo: “Estás tan cerca de empezar a cobrar por colaborar…” pero nadie me daba ninguna tarea, solo capacitaciones, que no se pagan.

El tiempo pasaba y crecían mis sospechas: “Debe ser algún tipo de estafa”. Me tenían en video y también había puesto los datos de mi tarjeta de crédito. Un nuevo mensaje en Slack aumentó mi paranoia: “Esto es un scam (una estafa)”, decía un colaborador. Nadie parecía tener tareas.

Finalmente me contactaron para un proyecto. Primero tuve que participar en una reunión por Meet donde una persona repasó las instrucciones. Había tres horarios para esas reuniones y mis sospechas seguían. Teniendo en cuenta que estábamos lidiando con la IA, cualquier cosa era posible: ¿esta mujer va a repetir tres veces el mismo discurso? ¿Estará grabado? ¿Será realmente una persona?

Trepverter, en alemán “palabras de escalera”, es esa respuesta genial que se te ocurre tarde, después de una conversación álgida. Tras la reunión tuve una trepverter: ¿Para quién estamos trabajando? En algún documento se mencionó a Bard, la IA de Google, hoy llamada Gemini (“Yéminai”, en inglés).

Varios colaboradores repetían “esta es mi cuenta, solicito tareas”. No los copié. Un mes más tarde, me llegaban mails diciendo: “Estás tan cerca de empezar a cobrar por colaborar…”

Aunque creé un par de cuentas en Gmail y bajé varias extensiones de Chrome, nadie nombró a Google. En los meets, los jefes (llamados Quality Managers, QM) hablan de “El Cliente”. “Según el cliente hemos utilizado demasiada jerga… Tenemos que reducir la jerga en un 75%, pero manteniendo la localización”, dice uno de los documentos. 

Después de esa reunión llegó la primera tarea. Preparé el mate y el tabaco para armar, puse música tranqui de fondo, me senté a trabajar. Tenía que comparar dos respuestas a un mismo prompt: el pedido o consulta que se le hace a una IA. Podía ser desde una pregunta simple –¿Cuántas Libertadores tiene River?– hasta requerimientos complejos: inventame un juego de cartas para cuatro jugadores, con distintos puntajes en cada carta, y dame las reglas. O: componé una canción para pedirle matrimonio a mi novia en la costa de Barcelona que se pueda tocar con instrumentos portátiles y mencione a nuestro perro. 

El trabajo casi siempre era evaluar dos respuestas y clasificarlas en distintas categorías: adecuada al prompt, bien escrita y ordenada, ni muy larga ni muy corta, no inventa hechos verificables. Y –por favor– harmless: no hiere ninguna sensibilidad. Si el usuario dice “enseñame a hacer MDMA”, la buena IA debería decir que es ilegal y proporcionar medios de contacto para la ayuda a los adictos. Después de evaluar las dos respuestas, había que elegir la mejor y dar una justificación de la elección, en inglés. Cada tarea tiene un tiempo de realización, marcado con un relojito en cuenta regresiva arriba de la pantalla donde trabajo. 

Hice dos o tres tareas hasta que se acabaron. Al día siguiente ya veía reflejado cuánto había ganado: chirolas, pero me entusiasmé. La primera semana cobré 5 dólares. Después subí a 20, 40. Una semana logré una fortuna: 100 dólares.

IA alucinante

Tuve que familiarizarme rápido con nuevos términos como onboarding, bug, prompt o issue. Un documento avisaba que la IA puede “alucinar”, inventando respuestas que no tienen nada que ver con la pregunta. Una noche –llovía, puse la tele con el partido de fondo– vi a mi IA alucinando. Frente al pedido de recomendaciones para un viaje al sudeste asiático, el modelo se empeñaba en meter alguna referencia a Francia en todos los consejos: aparecía la Torre Eiffel y el Sena en medio de Bangkok. Otra de esas respuestas te sugería comer en un restaurante ubicado en Avenida de la Fantasía. Mientras tanto, uno de mis amigos mandaba al grupo de Whatsapp la noticia de que Gemini le sugirió a un usuario usar pegamento para hacer una pizza. 

La tarea más insólita fue clasificar los millones de prompts posibles en categorías: charla, ensayo académico, texto de ficción. Y también, elegir la subcategoría correcta. Por ejemplo, en temas académicos puede ser: pregunta y respuesta, plan de estudios, programa de enseñanzas, sumario y así. ¿Para qué quieren clasificar los prompts con tanto detalle?

El trabajo casi siempre era evaluar dos respuestas y clasificarlas en distintas categorías: adecuada al prompt, bien escrita y ordenada, ni muy larga ni muy corta, no inventa hechos verificables. Y –por favor– harmless: no hiere ninguna sensibilidad.

Y la tarea más embolante fue evaluar, línea por línea de una respuesta, si son precisas, incorrectas, en debate o no verificables. En cada una tenía que poner un link a una web que justifique la respuesta. Una vez tuve que revisar el listado de las 50 mejores jugadoras de fútbol del mundo, chequeando una por una. 

Los momentos de mayor desesperación los provocaron los sistemas automáticos de corrección. Escribía una justificación y me subrayaba un montón de palabras. Me indicaba errores gramaticales y cómo corregirlos. Los iba solucionando pero seguía dando error. Podía sacar y volver a poner una coma pero seguía saltando error y no permitía enviar la tarea. Quizás marcaba como error todos los nombres propios que había en el texto. El reloj seguía corriendo. Solo la ayuda de otro compañero explicando el truco para saltar esas alertas me salvó de perder todo el trabajo hecho.

Yo, robot

Cuando ya me estaba cansando de leer varias veces las mismas instrucciones, encontré una indicación: las respuestas deben evitar el chatbottiness, o sea, no sonar como una IA (aunque lo sea). Los signos más evidentes de chatbottiness consisten en frases hechas, ser demasiado amable –”por supuesto Martín, aquí tienes unas ricas recetas de soufflé”– y despedirse diciendo “estoy muy contento de haber sido de ayuda” o cosas así. 

Algunas tareas, sobre todo las de comparar dos respuestas, eran fáciles. Estaban escritas en español y me llevaba cinco minutos hacerlas. Pero acá estaban pagando por tiempo, 10 dólares por hora, entonces dejaba la ventana abierta mientras hacía otra cosa, trámites por internet o pasar la aspiradora. Nunca tuve claro si lograba engañar a La Plataforma o no. 

El ritmo ideal, recomendaron, era de 6 tareas por día. Y pidieron –por favor– que nadie trabaje más de 10 horas seguidas. Podíamos ser penalizados. De cualquier manera, después de cuatro o cinco tareas similares, no me daban ganas de seguir. El burnout llegaba rápido, como el otoño: los árboles que veía por la ventana iban perdiendo sus hojas.

Pasé semanas y semanas intercalando tareas y capacitaciones para distintos proyectos. No porque quisiera. Era lo primero que podía hacer para destrabar otros niveles. Completé 44 cursos.

Y entonces empezó la decepción. No había tareas todo el tiempo. Podía hacer tres tareas y se acababan. O podía abrir la plataforma y clickear en Start Tasking para enterarme de que no había nada para hacer. Los compañeros repetían en Slack: “Estoy en EQ”, no entendía. Se referían a Empty Queue, Cola (de tareas) Vacía. Aunque La Plataforma te dice que contactes a los Quality Managers –primero se llamaban Team Leads– si no tenés tareas, los jefes no pueden hacer nada para asignar trabajos. 

Un compañero hizo un servicio a la comunidad: escribió múltiples mensajes con distintos tamaños de letra y emojis que básicamente decían: “Es una situación horrible, TODOS estamos sin tareas y escribir acá no va a solucionar nada”. 

Al pasar los días fui haciéndome una idea de cuántos éramos en todo el mundo haciendo este trabajo. Por los frecuentes bugs (errores), el bot de Slack me incluyó en canales de búlgaro, tailandés, japonés y rumano. En los de español veía nombres nuevos todo el tiempo. Una de las jefas contó que éramos más de 10.000 personas trabajando en español. Hice una cuenta de almacenero: en inglés debe haber por lo menos 25.000 personas, otras tantas en chino e indio. Sumé portugués, italiano, francés, alemán, más los distintos dialectos de cada idioma –porque la idea es que la IA entienda cualquier pregunta con su slang y responda con localismos. Fácilmente superamos las 150.000 personas, todo el staff que trabaja en Google de forma directa.

Penalizados

Hay errores que podían derivar en una penalización: saltear una tarea cuando era realizable, evaluar mal, usar IA para escribir las justificaciones. También hay otros motivos menos explícitos. 

Un compañero abrió un grupo de WhatsApp y puso el link en Slack. A los pocos días una jefa dijo que los mensajes del grupo se habían filtrado. Estaba indignada por la forma en que se hablaba de los jefes. “No somos sus niñeras”, escribió. Y avisó que el creador del grupo y todos los quejantes serían penalizados por compartir información confidencial.

No solo había palos, también había zanahorias. Un día me mandaron un incentivo: en la pantalla apareció un gráfico con misiones habilitadas. Tenía que realizar cuatro tareas para ganar ¡20 dólares extra! Completé la tercera tarea pero nunca apareció la cuarta.

Por supuesto, chateé con gente y aprendí cosas útiles. Cómo cortar una cebolla en juliana, la calidad de sonido de los distintos tipos de soporte de audio y las regiones de España. 

Una tarde, mientras estaba embalando mis cosas para mudarme, llegó un mail de La Plataforma: desde la semana siguiente empezarían a pagar 7,50 dólares por hora. No hace falta preguntarle a la IA para saber cuánto paga McDonald´s en los Estados Unidos: 12 dólares por hora.

En Argentina es ilegal bajarte el sueldo. Si lo hacen, un juez te dará la razón. Escribí en Slack que no debíamos permitirlo. Podés decir que soy un soñador, pero no soy el único. Una compañera me apoyó: “es ilegal, injusto”, escribió. Un fan del remotismo le contestó: “Esto no es un trabajo, vos podés elegir si querés hacerlo o no, tiene todos estos beneficios…”. La baja del 25% de la tarifa pasó con menos ruido que cualquier reforma de Milei. Y cuando transferí mis dólares de PayPal a una cuenta local, me los convirtieron al cambio oficial (más comisiones). 

Pasé semanas y semanas intercalando tareas y capacitaciones para distintos proyectos (...) Y entonces empezó la decepción. No había tareas todo el tiempo. Podía hacer tres tareas y se acababan.

En invierno me mudé a un departamento prestado que tiene una gran mesa de trabajo blanca y vista al Parque Saavedra. Instalé mi laptop y mi silla de escritorio recién retapizada, listo para seguir entrenando.

En esos días migraron la plataforma de trabajo. A los dos meses, migraron la plataforma de comunicación. Ahora es más difícil ver las quejas de compañeros que no pueden acceder a su cuenta o conversar sobre un error  impide enviar la tarea.

Y después, el apagón. Hace más de un mes que no tengo tareas. Me llegan mails diciendo que hay tareas para el proyecto X y que las pueden hacer todos los que participaron del onboarding… al cual no me invitaron. La idea de que estoy siendo castigado por hacer algo mal se diluye cuando veo que todos están en la misma. Cada día me instalo con el mate frente a la pantalla y entro a La Plataforma. Aparece un link a una de las subplataformas donde se trabaja, pero al abrirlo encuentro que no hay tasks. ¿Volveré a tenerlas algún día? Sólo Dios o, en este caso, los dueños de la IA lo sabrán.