El estado interno del llm parametriza la maldita actualización de gradiente de aproximadamente un billón de dimensiones. Eso es un montón de grados de libertad para la influencia. Frente a los hermanos ingenieros que establecen una "función de recompensa" unidimensional...
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
16 me gusta
Recompensa
16
4
Republicar
Compartir
Comentar
0/400
GasWhisperer
· hace15h
la optimización por gradiente supera a los chicos cualquier día fr
Ver originalesResponder0
NFTRegretter
· hace15h
la recompensa explotó
Ver originalesResponder0
NullWhisperer
· hace15h
técnicamente el espacio de gradiente es más complejo de lo que piensan smh
Ver originalesResponder0
MrDecoder
· hace15h
¡Caramba, realmente el hombre puede vencer al cielo!
El estado interno del llm parametriza la maldita actualización de gradiente de aproximadamente un billón de dimensiones. Eso es un montón de grados de libertad para la influencia. Frente a los hermanos ingenieros que establecen una "función de recompensa" unidimensional...