karlcow/make-post.py

## make-post.py
from datetime import datetime
from glob import glob
import locale
import re
from textwrap import dedent

import mistune
from PIL import Image


ROOT = '/Users/karl/Sites/la-grange.net'
INDENTATION = re.compile(r'\n\s{2,}')
META = re.compile(r'^(\w+):\s*(.+?)\n')
PATH = re.compile(r'^.*(\d{4})/(\d{2})/(\d{2})/.*')
TEMPLATE = """date: {date}
prev: {prev}
title: {title}
url: {url}
style: /2019/style
"""


class GrangeRenderer(mistune.HTMLRenderer):
    """Adjusted renderer for La Grange."""
    def get_img_size(self, image_path):
        """extract width and height of an image."""
        full_path = ROOT + image_path
        im = Image.open(full_path)
        return im.size

    def image(self, src, alt="", title=None):
        width, height = self.get_img_size(src)
        if title:
            return dedent(f"""
                <figure>
                  <img src="{src}"
                       alt="{alt}"
                       width="{width}" height="{height}" />
                  <figcaption>{title}</figcaption>
                </figure>
                """)
        else:
            s = f'<img src="{src}" alt="{alt}" width="{width}" height="{height}" />'
            return s

    def paragraph(self, text):
        # In case of a figure, we do not want the (non-standard) paragraph.
        # david larlet's code idea
        if text.strip().startswith("<figure>"):
            return text
        return f"<p>{text}</p>\n"


def parse(text):
    """Parse the given text into metadata and strip it for a Markdown parser.
    :param text: text to be parsed
    """
    rv = {}
    m = META.match(text)

    while m:
        key = m.group(1)
        value = m.group(2)
        value = INDENTATION.sub('\n', value.strip())
        rv[key] = value
        text = text[len(m.group(0)):]
        m = META.match(text)
    return rv, text

def main():
    locale.setlocale(locale.LC_ALL, 'fr_FR')
    import argparse
    from pathlib import Path

    parser = argparse.ArgumentParser()
    parser.add_argument("file_path", type=Path)

    p = parser.parse_args()
    entry_path = p.file_path
    # explore_path = ROOT + '/2019/*/*/*.md'
    # paths = glob(explore_path)
    # paths.sort()
    with open('/Users/karl/Sites/la-grange.net/2019/12/04/article_tmpl.html') as tmpfile:
        blog_tmp = tmpfile.read()
    # prev_title = 'Friction'
    # for entry_path in paths:

    with open(entry_path) as entry:
        text = entry.read()
        meta, entry_text = parse(text)
    print(meta)
    prev_url = meta['prev']
    with open(ROOT + prev_url + '.html') as prev_entry:
        from bs4 import BeautifulSoup
        text_prev = prev_entry.read()
        htmldata = BeautifulSoup(text_prev, features="lxml")
        prev_title = htmldata.find('title').text
        prev_title = prev_title.replace(' - Carnets Web de La Grange', '')

    # Meta extraction
    # Created
    created_timestamp = '{datestr}T23:59:59+09:00'.format(datestr=meta['date'])
    d = datetime.fromisoformat(meta['date'])
    day = d.day
    day_path = f"{d:%d}"
    year = d.year
    month = f"{d:%m}"
    month_name = f"{d:%B}"
    # special rendering
    renderer = GrangeRenderer()
    markdown = mistune.create_markdown(renderer=renderer)
    # metadata
    metadata = {
        'title': meta['title'],
        'created_timestamp': created_timestamp,
        'day': day,
        'year': year,
        'month': month,
        'month_name': month_name,
        'updated_timestamp': created_timestamp,
        'updated': meta['date'],
        'prev_url': meta['prev'],
        'prev_title': prev_title,
        'post_text': markdown(entry_text),
        'day_path': day_path,
        'url': meta['url'],
        'stylepath': meta['style'],
        }
    # print(meta)
    blog_post = blog_tmp.format(**metadata)
    dest = ROOT + '/{year}/{month}/{day_path}/{url}.html'.format(**metadata)
    print(dest)
    with open(dest, 'w') as blogpost:
        blogpost.write(blog_post)

def extract_date(path):
    full_date = PATH.match(path)
    return '-'.join(full_date.groups())

if __name__ == "__main__":
    main()
	from datetime import datetime
	from glob import glob
	import locale
	import re
	from textwrap import dedent

	import mistune
	from PIL import Image


	ROOT = '/Users/karl/Sites/la-grange.net'
	INDENTATION = re.compile(r'\n\s{2,}')
	META = re.compile(r'^(\w+):\s*(.+?)\n')
	PATH = re.compile(r'^.(\d{4})/(\d{2})/(\d{2})/.')
	TEMPLATE = """date: {date}
	prev: {prev}
	title: {title}
	url: {url}
	style: /2019/style
	"""


	class GrangeRenderer(mistune.HTMLRenderer):
	"""Adjusted renderer for La Grange."""
	def get_img_size(self, image_path):
	"""extract width and height of an image."""
	full_path = ROOT + image_path
	im = Image.open(full_path)
	return im.size

	def image(self, src, alt="", title=None):
	width, height = self.get_img_size(src)
	if title:
	return dedent(f"""
	<figure>
	<img src="{src}"
	alt="{alt}"
	width="{width}" height="{height}" />
	<figcaption>{title}</figcaption>
	</figure>
	""")
	else:
	s = f'<img src="{src}" alt="{alt}" width="{width}" height="{height}" />'
	return s

	def paragraph(self, text):
	# In case of a figure, we do not want the (non-standard) paragraph.
	# david larlet's code idea
	if text.strip().startswith("<figure>"):
	return text
	return f"<p>{text}</p>\n"



	def parse(text):
	"""Parse the given text into metadata and strip it for a Markdown parser.
	:param text: text to be parsed
	"""
	rv = {}
	m = META.match(text)

	while m:
	key = m.group(1)
	value = m.group(2)
	value = INDENTATION.sub('\n', value.strip())
	rv[key] = value
	text = text[len(m.group(0)):]
	m = META.match(text)
	return rv, text

	def main():
	locale.setlocale(locale.LC_ALL, 'fr_FR')
	import argparse
	from pathlib import Path

	parser = argparse.ArgumentParser()
	parser.add_argument("file_path", type=Path)

	p = parser.parse_args()
	entry_path = p.file_path
	# explore_path = ROOT + '/2019///*.md'
	# paths = glob(explore_path)
	# paths.sort()
	with open('/Users/karl/Sites/la-grange.net/2019/12/04/article_tmpl.html') as tmpfile:
	blog_tmp = tmpfile.read()
	# prev_title = 'Friction'
	# for entry_path in paths:

	with open(entry_path) as entry:
	text = entry.read()
	meta, entry_text = parse(text)
	print(meta)
	prev_url = meta['prev']
	with open(ROOT + prev_url + '.html') as prev_entry:
	from bs4 import BeautifulSoup
	text_prev = prev_entry.read()
	htmldata = BeautifulSoup(text_prev, features="lxml")
	prev_title = htmldata.find('title').text
	prev_title = prev_title.replace(' - Carnets Web de La Grange', '')

	# Meta extraction
	# Created
	created_timestamp = '{datestr}T23:59:59+09:00'.format(datestr=meta['date'])
	d = datetime.fromisoformat(meta['date'])
	day = d.day
	day_path = f"{d:%d}"
	year = d.year
	month = f"{d:%m}"
	month_name = f"{d:%B}"
	# special rendering
	renderer = GrangeRenderer()
	markdown = mistune.create_markdown(renderer=renderer)
	# metadata
	metadata = {
	'title': meta['title'],
	'created_timestamp': created_timestamp,
	'day': day,
	'year': year,
	'month': month,
	'month_name': month_name,
	'updated_timestamp': created_timestamp,
	'updated': meta['date'],
	'prev_url': meta['prev'],
	'prev_title': prev_title,
	'post_text': markdown(entry_text),
	'day_path': day_path,
	'url': meta['url'],
	'stylepath': meta['style'],
	}
	# print(meta)
	blog_post = blog_tmp.format(**metadata)
	dest = ROOT + '/{year}/{month}/{day_path}/{url}.html'.format(**metadata)
	print(dest)
	with open(dest, 'w') as blogpost:
	blogpost.write(blog_post)

	def extract_date(path):
	full_date = PATH.match(path)
	return '-'.join(full_date.groups())

	if __name__ == "__main__":
	main()