Skip to content

Instantly share code, notes, and snippets.

@denisxab
Last active October 7, 2022 19:54
Show Gist options
  • Save denisxab/3c22dbf14dd11b06f30f1a6997a136b5 to your computer and use it in GitHub Desktop.
Save denisxab/3c22dbf14dd11b06f30f1a6997a136b5 to your computer and use it in GitHub Desktop.
НезависимыйHTMLФайл
"""
Сборщик HTML
"""
import re
from base64 import b64encode
from pathlib import Path
import sys
from typing import Optional
import requests
class InterdependentHtmlFile:
"""
Класс для сборки независимого HTML файла
"""
@classmethod
def Insert_CSS_JS_FROM_HTML(cls, source_text: str, path: Path) -> tuple[str, Optional[Path]]:
"""
Вставить CSS и JS который указан в HTML файле.
:param source_text: Html текст
:param path: Путь к файлу исходному html файлу, для построения относительных импортов
:Пример:
```py
<head>
<link rel="stylesheet" href="../style.min.css">
<script src="./logic.js" defer></script>
</head>
```
"""
NL = "\n"
def _self(m: re.Match):
nonlocal path
if m['path_css']:
m_path: Path = (path / Path(m['path_css'])).resolve()
suffix: str = m_path.suffix
if suffix == '.css':
css_text = m_path.read_text()
# Удаляем комментарии
css_text = re.sub(
"(\/\*\n*(?:.\s*(?!\*\/))+.\*\/)|(\n\/\/.+)", '', css_text)
return f"""<style>\n{css_text.replace(NL, '')}\n</style>"""
elif m['path_js']:
m_path: Path = (path / Path(m['path_js'])).resolve()
suffix: str = m_path.suffix
if suffix == '.js':
js_text = m_path.read_text()
# Удаляем комментарии
js_text = re.sub(
"(\/\*\n*(?:.\s*(?!\*\/))+.\*\/)|(\/\/.+)", '', js_text)
js_text = re.sub('( {2,})|(\n)', '', js_text)
return f"""<script>\n{js_text}\n</script>"""
raise ValueError(f"Ни чего не найдено:{m.group(0)}")
СкрытьКомментарии: re.Pattern = re.compile(
"""<!--(?:.\s*(?!-->))+.-->""")
source_text = СкрытьКомментарии.sub('', source_text)
НайтиCssИлиJS: re.Pattern = re.compile(
"""(<link(?:.(?!href))* +href=\"(?P<path_css>[^\"]+)\"[^>]*>)|(<script +src=\"(?P<path_js>[^\"]+)\"[^>]*></script>)""")
return НайтиCssИлиJS.sub(_self, source_text), path
@classmethod
def SavePhoto(cls, source_text: str, path: Path) -> tuple[str, Optional[Path]]:
"""
Сохранить в HTML файл изображения
:param source_text: Html текст
:param path: Путь к файлу исходному html файлу, для построения относительных импортов
"""
cachy_img: dict[str, str] = {}
CACHY_IMG_JS: str = "CACHY_IMG_JS"
def _self(m: re.Match):
nonlocal path, cachy_img
if m['path_img']:
m_path: Path = (path / Path(m['path_img'])).resolve()
suffix: str = m_path.suffix
if m_path.exists():
# Кодируем фото в base64
m_base64: str = b64encode(
m_path.read_bytes()).decode('ascii')
# Проверяем на формат изображения на то что он допустимый
m_type_img: Optional[str] = {
"png": "png",
"jpeg": "jpeg",
"jpg": "jpg",
"gif": "gif",
"bmp": "bmp",
"tiff": "tiff",
"icon": "x-icon",
"svg": "svg+xml",
"webp": "webp",
"xxx": "xxx"
}.get(suffix[1:], None)
if m_type_img:
# Сохраняем результат в кеш, который потом вставиться в JS переменную, из которой в потом заполниться тег <img>
if not cachy_img.get(m['path_img'], None):
cachy_img[(
m['path_img'])] = f"data:image/{m_type_img};base64,{m_base64}"
res_text = m.group(0)
res_text = re.sub('src=\"[^\"]+\"', 'src=""', res_text)
if re.search('class=\"', res_text):
# Если уже есть классы до добавляем текст в конец
res_text = re.sub(
'class=\"(?P<class_name>[^\"]+)\"',
lambda _m: f''' class="{_m['class_name']} {CACHY_IMG_JS}"''',
res_text
)
# Если классов нет, то создаем класс
else:
res_text = re.sub(
">$", f''' class="{CACHY_IMG_JS}" >''', res_text)
# Вставляем ключ, по которому будет искаться изображение в кеше
res_text = re.sub(
">$", f''' path="{m['path_img']}" >''', res_text)
return res_text # f'''<img class="{CACHY_IMG_JS}" path="{m['path_img']}" src="">'''
else:
raise KeyError("Не допустимый формат изображения")
raise FileNotFoundError(f"Файл не найден: {m_path}")
raise ValueError(f"Ни чего не найдено:{m.group(0)}")
СсылкаНаФото: re.Pattern = re.compile(
"<img.+src=\"(?P<path_img>[^\"]+)\"[^>]+>")
_res = (
f"""
{СсылкаНаФото.sub(_self, source_text)}
<script>
// При запуске странице выводим в тег `img` атрибут `src` изображения из кеша JavaScript, эта
// махинация нужна чтобы не хранить дубли фото в html
const CACHY_IMG_JS={cachy_img}
document.querySelectorAll('.{CACHY_IMG_JS}').forEach((elm) => {{
res = elm.attributes['path'].textContent
elm.attributes['src'].textContent = CACHY_IMG_JS[res]
}});
</script>
""", path
)
return _res
@classmethod
def Build(cls, in_path: str, out_path: str):
"""
Собрать Независимый HTML Файл
:param in_path: Путь к исходному HTML файлу
:param out_path: Путь куда сохранить результат
"""
p_out_path = Path(out_path).resolve()
p_in_path: Path
p_text: str
if re.search('https?|localhost', in_path):
# Скачать из интернета
# TODO: Это не реализовано
_res = requests.get(in_path)
p_text = _res.text
raise ValueError("Не реализовано скачивание из интернета")
else:
# Взять локально
p_in_path = Path(in_path).resolve()
p_text = p_in_path.read_text()
p_in_path = p_in_path.parent
_res = cls.SavePhoto(*cls.Insert_CSS_JS_FROM_HTML(p_text, p_in_path))
p_out_path.write_text(_res[0])
return True
if __name__ == '__main__':
path_in_html = sys.argv[1]
path_out_html = sys.argv[2]
InterdependentHtmlFile.Build(
path_in_html,
path_out_html
)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment