Giorgio g-i-o-r-g-i-o

## gpt2_from_scratch.py
from simpletransformers.language_modeling import LanguageModelingModel
import logging


logging.basicConfig(level=logging.INFO)
transformers_logger = logging.getLogger("transformers")
transformers_logger.setLevel(logging.WARNING)


train_args = {

## almost-attention.py
# This code doesn't work, and isn't intended to.
# The goal of this code is to explain how attention mechansisms work, in code.
# It is deliberately not vectorized to make it clearer.

def attention(self, X_in:List[Tensor]):
    # For every token transform previous layer's out
    for i in range(self.sequence_length):
        query[i] = self.Q * X_in[i]
        key[i]   = self.K * X_in[i]
        value[i] = self.V * X_in[i]

## freshest_camera_frame.py
#!/usr/bin/env python3

'''
always getting the most recent frame of a camera
================================================

Usage:
------
    freshest_camera_frame.py
	from simpletransformers.language_modeling import LanguageModelingModel
	import logging


	logging.basicConfig(level=logging.INFO)
	transformers_logger = logging.getLogger("transformers")
	transformers_logger.setLevel(logging.WARNING)


	train_args = {
	# This code doesn't work, and isn't intended to.
	# The goal of this code is to explain how attention mechansisms work, in code.
	# It is deliberately not vectorized to make it clearer.

	def attention(self, X_in:List[Tensor]):
	# For every token transform previous layer's out
	for i in range(self.sequence_length):
	query[i] = self.Q * X_in[i]
	key[i] = self.K * X_in[i]
	value[i] = self.V * X_in[i]
	#!/usr/bin/env python3

	'''
	always getting the most recent frame of a camera
	================================================

	Usage:
	------
	freshest_camera_frame.py