Skip to content

Instantly share code, notes, and snippets.

@realamirhe
Last active July 19, 2020 17:51
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save realamirhe/462756ab487ddef7c0603ec26b7868d7 to your computer and use it in GitHub Desktop.
Save realamirhe/462756ab487ddef7c0603ec26b7868d7 to your computer and use it in GitHub Desktop.
fix: major bug caused in replacement
import clipboard
paragraph = """
مجموعه دادگان بررسی شده که مورد پذیرش قرار نگرفتندcaltech101،cats_vs_dogs، caltech_birds2010، colorectal_histology، coil100، dmlabو DTD
برای سادگی و ادامه توضیحات نام گذاری‌ها را فارسی میکنیم
lfw (صورت‌های برچسب‌گذاری غرب (ص.ب.غ))، celeb_a ( مشهور الف )
توضیح کلی در مورد دو مجموعه مورد پذیرش بالاهر دو در منابع مجموعه دادگان tensorflow موجود هستند. اندازه (مشاهیرالف) تقریبا 8 برابر (ص.ب.غ) است پس در صورت انتخاب نیاز به منابع بیشتری برای مرحله‌ی آموزش داریم.
( صورت‌های برچسب‌گذاری‌شده غرب )
تصاویر برچسب گذاری‌شده که برای تشخیص تصویر در شرایط بدون قید بررسی شده‌اند.
نسخه‌ای که در دسترس هست نسخه ۰.۱.۰ است‌
تعداد ۱۳۲۳۳ داده در مجموعه آموزش موجود هست
تصاور ۲۵۰ در ۲۵۰ هستند
(مشهور الف)
تصاویر بیش از۲۰۰هزار فرد مشهور که در ۴۰ دسته بخش‌بندی شده‌اند. تصاویر دارای پس‌زمینه‌ و ژست‌های متفاوتی هستند. از طرفی چون گوناگونی داده ها طبق توضیح خود ارائه دهنده زیاد است، شاید محبور شویم بخشی از انها را حذف کنیم.
کیفیت تصاویر بالااست لذا نیاز به کاهش بعد (dimension reduction) و استفاده از روش های (chroma subsampling) نیاز میشود.
تعداد ۲۰۲۵۹۹ عکس صورت در مجموعه هست که بیشتر از کل داده های فاز آموزش ص.ب.غاست.
بر خلاف (ص.ب.غ) تصاویر برچسب ندارند و ۴۰ دسته ویژگی برای آنها اورده شده که ملاک برتری مناسبی نیست زیرا این ویژگی‌ها مورد نیاز ما نخواهند بود مگر در موارد خاص برای دسته بندی داده‌ها.نسخه‌ای که در دسترس هست نسخه ۲.۰.۰ است که نسبت به (ص.ب.غ) تغیرات بیشتری داشته و پویا‌تر است.
با توجه به توضیحات بالا و این نکته که image-Inpainting در تصاویر صورت جذاب تر و هوشمندانه‌تر از neighbour-sampling عمل میکنداین دو مجموعه دادگان به ضورت مشخصا روی (مشاهیر الف) و به صورت نتیجه بهتر ترکیبی از این دو مجموعه خواهد بود.
"""
# merge and standardize text, Note: multiple spaces won't effect your text in LaTeX
words = list(filter(lambda x: x, paragraph.split(" ")))
saved_index = None
for i in range(len(words)):
if words[i].isascii():
if (saved_index is not None):
words[saved_index] = words[saved_index] + "$__$" + words[i]
words[i] = ""
else:
saved_index = i
words[saved_index] = "\lr{ "+words[saved_index]
else:
if (saved_index is not None):
words[saved_index] = words[saved_index] + " }"
saved_index = None
if (saved_index is not None):
words[saved_index] = words[saved_index] + " }"
# copy data to clipboard, it can be printed either
clipboard.copy(" ".join(words).replace('$__$', ' '))
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment