Last active
July 19, 2020 17:51
-
-
Save realamirhe/462756ab487ddef7c0603ec26b7868d7 to your computer and use it in GitHub Desktop.
fix: major bug caused in replacement
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
import clipboard | |
paragraph = """ | |
مجموعه دادگان بررسی شده که مورد پذیرش قرار نگرفتندcaltech101،cats_vs_dogs، caltech_birds2010، colorectal_histology، coil100، dmlabو DTD | |
برای سادگی و ادامه توضیحات نام گذاریها را فارسی میکنیم | |
lfw (صورتهای برچسبگذاری غرب (ص.ب.غ))، celeb_a ( مشهور الف ) | |
توضیح کلی در مورد دو مجموعه مورد پذیرش بالاهر دو در منابع مجموعه دادگان tensorflow موجود هستند. اندازه (مشاهیرالف) تقریبا 8 برابر (ص.ب.غ) است پس در صورت انتخاب نیاز به منابع بیشتری برای مرحلهی آموزش داریم. | |
( صورتهای برچسبگذاریشده غرب ) | |
تصاویر برچسب گذاریشده که برای تشخیص تصویر در شرایط بدون قید بررسی شدهاند. | |
نسخهای که در دسترس هست نسخه ۰.۱.۰ است | |
تعداد ۱۳۲۳۳ داده در مجموعه آموزش موجود هست | |
تصاور ۲۵۰ در ۲۵۰ هستند | |
(مشهور الف) | |
تصاویر بیش از۲۰۰هزار فرد مشهور که در ۴۰ دسته بخشبندی شدهاند. تصاویر دارای پسزمینه و ژستهای متفاوتی هستند. از طرفی چون گوناگونی داده ها طبق توضیح خود ارائه دهنده زیاد است، شاید محبور شویم بخشی از انها را حذف کنیم. | |
کیفیت تصاویر بالااست لذا نیاز به کاهش بعد (dimension reduction) و استفاده از روش های (chroma subsampling) نیاز میشود. | |
تعداد ۲۰۲۵۹۹ عکس صورت در مجموعه هست که بیشتر از کل داده های فاز آموزش ص.ب.غاست. | |
بر خلاف (ص.ب.غ) تصاویر برچسب ندارند و ۴۰ دسته ویژگی برای آنها اورده شده که ملاک برتری مناسبی نیست زیرا این ویژگیها مورد نیاز ما نخواهند بود مگر در موارد خاص برای دسته بندی دادهها.نسخهای که در دسترس هست نسخه ۲.۰.۰ است که نسبت به (ص.ب.غ) تغیرات بیشتری داشته و پویاتر است. | |
با توجه به توضیحات بالا و این نکته که image-Inpainting در تصاویر صورت جذاب تر و هوشمندانهتر از neighbour-sampling عمل میکنداین دو مجموعه دادگان به ضورت مشخصا روی (مشاهیر الف) و به صورت نتیجه بهتر ترکیبی از این دو مجموعه خواهد بود. | |
""" | |
# merge and standardize text, Note: multiple spaces won't effect your text in LaTeX | |
words = list(filter(lambda x: x, paragraph.split(" "))) | |
saved_index = None | |
for i in range(len(words)): | |
if words[i].isascii(): | |
if (saved_index is not None): | |
words[saved_index] = words[saved_index] + "$__$" + words[i] | |
words[i] = "" | |
else: | |
saved_index = i | |
words[saved_index] = "\lr{ "+words[saved_index] | |
else: | |
if (saved_index is not None): | |
words[saved_index] = words[saved_index] + " }" | |
saved_index = None | |
if (saved_index is not None): | |
words[saved_index] = words[saved_index] + " }" | |
# copy data to clipboard, it can be printed either | |
clipboard.copy(" ".join(words).replace('$__$', ' ')) |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment