Terry Chan napoler

## markdown_to_text.py
from bs4 import BeautifulSoup
from markdown import markdown

def markdown_to_text(markdown_string):
    """ Converts a markdown string to plaintext """

    # md -> html -> text since BeautifulSoup can extract text cleanly
    html = markdown(markdown_string)

    # remove code snippets

## 0-howto-listfield-django-admin.rst

      
              4 files
            
          
              0 forks
            
          
              0 comments
            
          
              0 stars
            
          
                napoler
                / 0-howto-listfield-django-admin.rst
            
            
              Last active
              August 18, 2022 05:56
                — forked from jonashaag/0-howto-listfield-django-admin.rst
            
              
                Howto use ListFields in Django's admin
              
          
    Howto use ListFields in Django's admin

Problem

Consider this blog post model:

models.py


## pegasus_fine_tune.py
"""Script for fine-tuning Pegasus
Example usage:
  # use XSum dataset as example, with first 1000 docs as training data
  from datasets import load_dataset
  dataset = load_dataset("xsum")
  train_texts, train_labels = dataset['train']['document'][:1000], dataset['train']['summary'][:1000]

  # use Pegasus Large model as base for fine-tuning
  model_name = 'google/pegasus-large'
  train_dataset, _, _, tokenizer = prepare_data(model_name, train_texts, train_labels)

## sts_sentence_embedding.py
from transformers import AutoTokenizer, AutoModel

def mean_pooling(model_output, attention_mask):
    """
    Mean pooling to get sentence embeddings. See:
    https://huggingface.co/sentence-transformers/paraphrase-distilroberta-base-v1
    """
    token_embeddings = model_output[0]
    input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
    sum_embeddings = torch.sum(token_embeddings * input_mask_expanded, 1) # Sum columns

## collate_fn_example.py
import torch
from torch.utils.data import Dataset, DataLoader
import numpy as np


class MyDataset(Dataset):
    def __init__(self):
        x = np.random.rand(1000, 3)  # 1000 3-dim samples
        self.x = [x[i].tolist() for i in range(1000)]
        y = np.random.randint(low=0, high=2, size=(1000,))

## SessionState.py
"""Hack to add per-session state to Streamlit.

Usage
-----

>>> import SessionState
>>>
>>> session_state = SessionState.get(user_name='', favorite_color='black')
>>> session_state.user_name
''

## kmeans_with_faiss.py
import faiss
import numpy as np


class FaissKMeans:
    def __init__(self, n_clusters=8, n_init=10, max_iter=300):
        self.n_clusters = n_clusters
        self.n_init = n_init
        self.max_iter = max_iter
        self.kmeans = None

## convlstm_cell
import torch.nn as nn
import torch


class ConvLSTMCell(nn.Module):

    def __init__(self, input_dim, hidden_dim, kernel_size, bias):
        """
        Initialize ConvLSTM cell.

## gist:90e1d9c6447cf26bf57b079cb067a578
import torch
import torch.nn as nn

from models.ConvLSTMCell import ConvLSTMCell

class EncoderDecoderConvLSTM(nn.Module):
    def __init__(self, nf, in_chan):
        super(EncoderDecoderConvLSTM, self).__init__()

        """ ARCHITECTURE

## model_with_noam.py
import torch
import pytorch_lightning as pl

class MyTransformer(pl.LightningModule):
    def __init__(
        self,
        learning_rate=0.001,
        warmup=4000,
    ):
      self.learning_rate = learning_rate
	from bs4 import BeautifulSoup
	from markdown import markdown

	def markdown_to_text(markdown_string):
	""" Converts a markdown string to plaintext """

	# md -> html -> text since BeautifulSoup can extract text cleanly
	html = markdown(markdown_string)

	# remove code snippets
	"""Script for fine-tuning Pegasus
	Example usage:
	# use XSum dataset as example, with first 1000 docs as training data
	from datasets import load_dataset
	dataset = load_dataset("xsum")
	train_texts, train_labels = dataset['train']['document'][:1000], dataset['train']['summary'][:1000]

	# use Pegasus Large model as base for fine-tuning
	model_name = 'google/pegasus-large'
	train_dataset, _, _, tokenizer = prepare_data(model_name, train_texts, train_labels)
	from transformers import AutoTokenizer, AutoModel

	def mean_pooling(model_output, attention_mask):
	"""
	Mean pooling to get sentence embeddings. See:
	https://huggingface.co/sentence-transformers/paraphrase-distilroberta-base-v1
	"""
	token_embeddings = model_output[0]
	input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
	sum_embeddings = torch.sum(token_embeddings * input_mask_expanded, 1) # Sum columns
	import torch
	from torch.utils.data import Dataset, DataLoader
	import numpy as np


	class MyDataset(Dataset):
	def __init__(self):
	x = np.random.rand(1000, 3) # 1000 3-dim samples
	self.x = [x[i].tolist() for i in range(1000)]
	y = np.random.randint(low=0, high=2, size=(1000,))
	"""Hack to add per-session state to Streamlit.

	Usage
	-----

	>>> import SessionState
	>>>
	>>> session_state = SessionState.get(user_name='', favorite_color='black')
	>>> session_state.user_name
	''
	import faiss
	import numpy as np


	class FaissKMeans:
	def __init__(self, n_clusters=8, n_init=10, max_iter=300):
	self.n_clusters = n_clusters
	self.n_init = n_init
	self.max_iter = max_iter
	self.kmeans = None
	import torch.nn as nn
	import torch


	class ConvLSTMCell(nn.Module):

	def __init__(self, input_dim, hidden_dim, kernel_size, bias):
	"""
	Initialize ConvLSTM cell.
	import torch
	import torch.nn as nn

	from models.ConvLSTMCell import ConvLSTMCell

	class EncoderDecoderConvLSTM(nn.Module):
	def __init__(self, nf, in_chan):
	super(EncoderDecoderConvLSTM, self).__init__()

	""" ARCHITECTURE
	import torch
	import pytorch_lightning as pl

	class MyTransformer(pl.LightningModule):
	def __init__(
	self,
	learning_rate=0.001,
	warmup=4000,
	):
	self.learning_rate = learning_rate