Preguntas con Tag: transformer-model
se refiere al modelo Transformer, especialmente utilizado para la comprensión y procesamiento del lenguaje natural y hecho popular por el papel Atención es todo lo que necesita.
¿Qué memoria usa Transformer Decoder?
He estado leyendo mucho acerca de los transformadores y la auto atención y he visto tanto BERT como GPT-2 son una versión más nueva que sólo utiliza un transformador de encoder (BERT) y transformad
python
pytorch
decoder
transformer-model
gpt-2
3 años, 5 meses, 6 días