Preguntas con Tag: transformer-model

se refiere al modelo Transformer, especialmente utilizado para la comprensión y procesamiento del lenguaje natural y hecho popular por el papel Atención es todo lo que necesita.

¿Qué memoria usa Transformer Decoder?

He estado leyendo mucho acerca de los transformadores y la auto atención y he visto tanto BERT como GPT-2 son una versión más nueva que sólo utiliza un transformador de encoder (BERT) y transformad
python pytorch decoder transformer-model gpt-2
codealchemy
3 años, 5 meses, 0 días