Created
February 20, 2012 03:44
-
-
Save vssun/1867654 to your computer and use it in GitHub Desktop.
replace.py fixes for dharmaraja ascii convertion
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
# -*- coding: utf-8 -*- | |
# | |
# This is only an example. Don't use it. | |
# version: 2.0 | |
fixes['wikisource'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു', | |
}, | |
'replacements': [ | |
(ur'അിനെ', u'അങ്ങനെ'), | |
(ur'അിോ', u'അങ്ങോ'), | |
(ur'ആഘര്യ', u'ആശ്ചര്യ'), | |
(ur'ഇി', u'ഇങ്ങ'), | |
(ur'ഈിാ', u'ഇങ്ങോ'), | |
(ur'ഈപ്പാ', u'ഇപ്പോ'), | |
(ur'ഉവാഹ', u'ഉത്സാഹ'), | |
(ur' ദ്ദർപ്പി', u' ഊർജ്ജി'), | |
(ur' ദ്ദ', u' ഊ'), | |
(ur'എിനെ', u'എങ്ങനെ'), | |
(ur' ̈', u' ഓ'), | |
(ur' ാെ', u'ക്കൊ'), #ഇതിന്റെ ക്രമം മാറ്റരുത്. | |
(ur' ാ', u'ക്കാ'), | |
(ur' ി', u'ക്കി'), | |
(ur' ു', u'ക്കു'), | |
(ur' ൂ', u'ക്കൂ'), | |
(ur' ്', u'ക്ക്'), | |
(ur' ൃ', u'ക്കൃ'), | |
(ur' ം', u'ക്കം'), | |
(ur' ̧', u'ക്ഷ'), #ശരിയല്ല. | |
(ur'ിിനെ', u'ിങ്ങനെ'), | |
(ur'ിിൾ', u'ിങ്ങൾ'), | |
(ur'ിാ', u'ങ്ങാ'), | |
(ur'ിി', u'ങ്ങി'), | |
(ur'ിീ', u'ങ്ങീ'), | |
(ur'ിു', u'ങ്ങു'), | |
(ur'ി്', u'ങ്ങ്'), | |
(ur'ിേ', u'ങ്ങേ'), | |
(ur'1ി', u'ങ്കി'), | |
(ur'ചെജ്ഞ', u'ചെയ്യ'), | |
(ur'1⁄4',u'ഞ്ഞ'), | |
(ur'1⁄ൽ', u'ട്ട'), | |
(ur'ൾ⁄4', u'ണ്ട'), | |
(ur'ൾെ⁄4', u'ണ്ടെ'), | |
(ur'ൾേ⁄4', u'ണ്ടേ'), | |
(ur'ൾേ⁄4ാ', u'ണ്ടോ'), | |
(ur'ആാ', u'ണ്ണാ'), | |
(ur'ആെ', u'ണ്ണെ'), | |
(ur'ആു', u'ണ്ണു'), | |
(ur'ആം ', u'ണ്ണം '), | |
(ur'ഝ്യ', u'ത്ഥ്യ'), | |
(ur'ദഹൌിത്രി', u'ദൗഹിത്രി'), | |
(ur'നിഘയ', u'നിശ്ചയ'), | |
(ur'ഌ', u'നീ'), | |
(ur' ബമ', u' ബദ്ധ'), | |
(ur'ബുമി', u'ബുദ്ധി'), | |
(ur'ബോമ്യ', u'ബോദ്ധ്യ'), | |
(ur'ബ്ര1', u'ബ്രഹ്മ'), | |
(ur'ബ്രാ1ണ', u'ബ്രാഹ്മണ'), | |
(ur'യ്വ', u'യ്വ'), | |
(ur'വൃമ', u'വൃദ്ധ'), | |
(ur'ംി', u'ഷ്ടി'), | |
(ur'ംീ', u'ഷ്ടീ'), | |
(ur'ർഎ', u'ർവ്വ'), | |
(ur'ർർ', u'ർച്ഛ'), | |
#രണ്ടാംഘട്ടം | |
(ur'ൽി', u'ക്തി'), | |
# (ur'1',u'ങ്ക') ഉപയോഗിക്കാനാകില്ല. | |
] | |
} | |
fixes['wikisource2'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു', | |
}, | |
'replacements': [ | |
(ur'അണ്ണാവജ്ഞ', u'അണ്ണാവയ്യ'), | |
(ur'ആി', u'ണ്ണി'), | |
(ur'അമ്യ', u'അദ്ധ്യ'), | |
(ur'ക്ക്̧', u'ക്ഷ്'), #check whether it is working well | |
(ur'ർാ', u'ച്ഛാ'), | |
(ur'ബഗ്ന', u'ബന്ധ'), | |
(ur'രഡി', u'രത്നങ്ങ'), | |
(ur'രഡ', u'രത്ന'), | |
(ur'ശുമി', u'ശുദ്ധി'), | |
(ur'ഫോക', u'ശ്ലോക'), | |
(ur'ംാ', u'ഷ്ടാ'), | |
(ur'സന്നമ', u'സന്നദ്ധ'), | |
(ur'സിമി', u'സിദ്ധി'), | |
(ur'ർഝ', u'ർത്ഥ'), | |
(ur'ർആ', u'ർണ്ണ') | |
] | |
} | |
fixes['wikisource3'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-3', | |
}, | |
'replacements': [ | |
(ur'ഈദ്ദ', u'ഇദ്ദേ'), | |
(ur'ഊദ്യാ', u'ഉദ്യോ'), | |
(ur'ഊദ്ദശ', u'ഉദ്ദേശ'), | |
(ur' ീ', u'ക്കീ'), | |
(ur'1ാ', u'ങ്കാ'), | |
(ur'1ു', u'ങ്കു'), | |
(ur'ആേ', u'ക്ലേ'), | |
(ur'പ്രഢൌ', u'പ്രൗഢ'), | |
(ur'പ്രസിമ', u'പ്രസിദ്ധ'), | |
(ur'രാമജ്ഞ', u'രാമയ്യ'), | |
(ur'സന്ദൌ', u'സൗന്ദ'), | |
(ur'ർമന', u'ർദ്ധന') | |
] | |
} | |
fixes['wikisource4'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-4', | |
}, | |
'replacements': [ | |
(ur'അർന', u'അച്ഛന'), | |
(ur'അർൻ', u'അച്ഛൻ'), | |
(ur'അന്തർനത', u'അന്തർഗ്ഗത'), | |
(ur'അർമ', u'അർദ്ധ'), | |
(ur'അജ്ഞോ', u'അയ്യോ'), | |
(ur'ഈല്ല', u'ഇല്ലേ'), | |
(ur'ഉപ്പ്വലി', u'ഉജ്ജ്വലി'), | |
(ur'ഉമാരണ', u'ഉദ്ധാരണ'), | |
(ur' ങ്കശ്വര്യ', u' ഐശ്വര്യ'), | |
(ur'ഔര', u'ഒരേ'), | |
(ur' ഞ്ച', u' ഔ'), | |
(ur'കുപ്പയാ', u'കുപ്പശ്ശാ'), | |
(ur'ിോ', u'ങ്ങോ'), | |
(ur' ഞിൾ', u' ഞങ്ങൾ'), | |
(ur' ഞിള', u'ഞങ്ങള'), | |
(ur'ആീ', u'ണ്ണീ'), | |
(ur'ദുംത', u'ദുഷ്ടത'), | |
(ur'നിഘല', u'നിശ്ചല'), | |
(ur'നേത്രിൾ', u'നേത്രങ്ങൾ'), | |
(ur'ബമ', u'ബദ്ധ'), | |
(ur' ഭൽ', u' ഭക്ത'), | |
(ur'യീലം', u'ശ്ശീലം'), | |
(ur'യവൌ', u'യൗവ'), | |
(ur'വർമി', u'വർദ്ധി'), | |
(ur'വാർമക്യ', u'വാർദ്ധക്യ'), | |
(ur'സഭൌ', u'സൗഭ'), | |
(ur'ർപ്പുന', u'ർജ്ജുന'), | |
(ur'ർണ്ണിള', u'ർണ്ണങ്ങള') | |
] | |
} | |
fixes['wikisource5'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-5', | |
}, | |
'replacements': [ | |
(ur'ാേ', u'ോ'), | |
(ur'ിൾക്ക്', u'ങ്ങൾക്ക്'), | |
(ur'ിെ', u'ങ്ങെ'), | |
(ur'കംം', u'കഷ്ടം'), | |
(ur' കംമ', u'കഷ്ടമ'), | |
(ur'കതൌുക', u'കൗതുക'), | |
(ur'കശൌ', u'കൗശ'), | |
(ur' ൾ', u'ക്കൾ'), | |
(ur'ൽാ', u'ക്താ'), | |
(ur'ൽ്', u'ക്ത്'), | |
(ur'ൽം', u'ക്തം'), | |
(ur'ക്ഷാേ', u'ക്ഷോ'), | |
(ur'ഗഗ്ന', u'ഗന്ധ'), | |
(ur'ഗർപ്പി', u'ഗർജ്ജി'), | |
(ur'1ീ', u'ങ്കീ'), | |
(ur'ഢുത', u'ത്ഭുത'), | |
(ur'തജ്ഞാറ', u'തയ്യാറ'), | |
(ur'നങ്ങിള', u'നീങ്ങള'), | |
(ur'പദനാഭ', u'പത്മനാഭ'), | |
(ur' പുർ', u' പുച്ഛ'), | |
(ur'പരൌാ', u'പൗരാ'), | |
(ur'പരൌു', u'പൗരു'), | |
(ur'ബുമ', u'ബുദ്ധ'), | |
(ur'മമ്യ', u'മദ്ധ്യ'), | |
(ur'മാഹാദ', u'മാഹാത്മ'), | |
(ur'ലിളു', u'ലങ്ങളു'), | |
(ur'ലകൌി', u'ലൗകി'), | |
(ur'വ്യൽമാ', u'വ്യക്തമാ'), | |
(ur' ശുമ', u' ശുദ്ധ'), | |
(ur'ം്', u'ഷ്ട്'), | |
(ur'സകൌര', u'സൗകര'), | |
(ur'സാന്നിമ്യ', u'സാന്നിദ്ധ്യ'), | |
(ur'സരൌ', u'സൗര') | |
] | |
} | |
fixes['wikisource6'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-6', | |
}, | |
'replacements': [ | |
(ur'അഗ്നകാര', u'അന്ധകാര'), | |
(ur'ആദാ', u'ആത്മാ'), | |
(ur'ഈത', u'ഇതേ'), | |
(ur' ഉമരി', u' ഉദ്ധരി'), | |
(ur'ങ്കശ്വര', u'ഐശ്വര'), | |
(ur'തത്വിൾ', u'തത്വങ്ങൾ'), | |
(ur'ഭശ്ച', u'ഭഞ്ജ'), | |
(ur'മശ്ചുള', u'മഞ്ജുള'), | |
(ur'മറനാ', u'മഗ്നനാ'), | |
(ur' മാർന', u' മാർഗ്ഗ'), | |
(ur'യുമ', u'യുദ്ധ'), | |
(ur' ലപ്പ', u' ലജ്ജ'), | |
(ur'വിസർന', u'വിസർഗ്ഗ'), | |
(ur'േഎ', u'വ്വേ'), | |
(ur'ശിള', u'ശങ്ങള'), | |
(ur'ശിൾ', u'ശങ്ങൾ'), | |
(ur'ശുമ', u'ശുദ്ധ'), | |
(ur'സപൌ', u'സൗപ'), | |
(ur' സിമ', u' സിദ്ധ'), | |
(ur'ഹിൾ', u'ഹങ്ങൾ'), | |
(ur'ർപ്പന', u'ർജ്ജന') | |
] | |
} | |
fixes['wikisource7'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-7', | |
}, | |
'replacements': [ | |
(ur'ഊപ', u'ഉപേ'), | |
(ur'കംത', u'കഷ്ടത'), | |
(ur'ിളേയും', u'ങ്ങളേയും'), | |
(ur'മേഘിൾ', u'മേഘങ്ങൾ'), | |
(ur'യുദ്ധായ', u'യുമായ'), | |
(ur'യുദ്ധി', u'യുമി'), | |
(ur'യുദ്ധെ', u'യുമെ'), | |
(ur'ല1ര', u'ലങ്കര'), | |
(ur'1ം', u'ങ്കം'), | |
(ur'സ1ൽ', u'സങ്കൽ') | |
] | |
} | |
fixes['wikisource8'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-8', | |
}, | |
'replacements': [ | |
(ur' ങ്ക', u' ഐ'), | |
(ur'ംം', u'ഷ്ടം'), | |
(ur'തി1ൾ', u'തിങ്കൾ'), | |
(ur'പകടയാല', u'പകടശ്ശാല'), | |
(ur'മോവാഹി', u'മോത്സാഹി'), | |
(ur'യ1ര', u'യങ്കര'), | |
(ur'യുദ്ധ്പ', u'യുമ്പ'), | |
(ur' വവര', u' വത്സര'), | |
(ur' വവല', u' വത്സല'), | |
(ur' വജ്ഞാ', u' വയ്യാ'), | |
(ur'വിദഗ്മ', u'വിദഗ്ദ്ധ'), | |
(ur'വൈദഗ്മ്യ', u'വൈദഗ്ദ്ധ്യ'), | |
(ur'സഗ്ന്യ', u'സന്ധ്യ'), | |
(ur'സ1ട', u'സങ്കട'), | |
(ur'സിമന', u'സിദ്ധന'), | |
(ur'സംഘി', u'സംഘങ്ങ') | |
] | |
} | |
fixes['wikisource9'] = { | |
'regex': True, | |
'msg': { | |
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-9', | |
}, | |
'replacements': [ | |
(ur'അി', u'അങ്ങ'), | |
(ur'ആദഗത', u'ആത്മഗത'), | |
(ur'ആദബലി', u'ആത്മബലി'), | |
(ur'ആദീയ', u'ആത്മീയ'), | |
(ur'ആയുധിൾ', u'ആയുധങ്ങൾ'), | |
(ur'ഊന്മഷ', u'ഉന്മേഷ'), | |
(ur'കരിളാ', u'കരങ്ങളാ'), | |
(ur'കാലിളി', u'കാലങ്ങളി'), | |
(ur'കുട്ടിക്കോന്തിയ', u'കുട്ടിക്കോന്തിശ്ശ'), | |
(ur' ട്ട', u'ക്കട്ട'), | |
(ur' ണ', u'ക്കണ'), | |
(ur'താ1ൾ', u'താങ്കൾ'), | |
(ur' ച്ച', u'ക്കച്ച'), | |
(ur' ഥ', u'ക്കഥ'), | |
(ur' ത്ത', u'ക്കത്ത'), | |
(ur' പ്പ', u'ക്കപ്പ'), | |
(ur' യും', u'ക്കയും'), | |
(ur' ല്ല', u'ക്കല്ല'), | |
(ur' ള', u'ക്കള'), | |
(ur' ഴ', u'ക്കഴ'), | |
(ur' ൽ', u'ക്കൽ'), | |
(ur' ന്തെു', u'ക്കെന്തു'), | |
(ur'1ര', u'ങ്കര'), | |
(ur'1ൂ', u'ങ്കൂ'), | |
(ur'ഗരൌ', u'ഗൗര'), | |
(ur'ഗ്രഹിളു', 'ഗ്രഹങ്ങളു'), | |
(ur'ിളുടെ', u'ങ്ങളുടെ'), | |
(ur'ിളെ ', u'ങ്ങളെ '), | |
(ur'ർ്വാ', u'ച്ഛ്വാ'), | |
(ur'ർി', 'ച്ഛി'), | |
(ur'ർീ', 'ച്ഛീ'), | |
(ur'ചെമ്പകയേരി', u'ചെമ്പകശ്ശേരി'), | |
(ur'ചേംക', u'ചേഷ്ട'), | |
(ur'ജാലിൾ', u'ജാലങ്ങൾ'), | |
(ur'ടിൾ', u'ടങ്ങൾ'), | |
(ur'ണിളിൽ', u'ണങ്ങളിൽ'), | |
(ur'ണ്ണിൾ', u'ണ്ണങ്ങൾ'), | |
(ur'ത1', u'തങ്ക'), | |
(ur'ത്യ്ര', u'ത്ര്യ'), | |
(ur'ദിൾ ', u'ദങ്ങൾ '), | |
(ur'ദിളിൽ', u'ദങ്ങളിൽ'), | |
(ur'ദുയകുന', u'ദുശ്ശകുന'), | |
(ur'ദുംനെ', u'ദുഷ്ടനെ'), | |
(ur'ദത്യൌ', u'ദൗത്യ'), | |
(ur'ദഷ്ട്യൌ', u'ദൗഷ്ട്യ'), | |
(ur'നിൾ ', u'നങ്ങൾ '), | |
(ur'നംമാ', u'നഷ്ടമാ'), | |
(ur'നംവു', u'നഷ്ടവു'), | |
(ur'നങ്ങിടെ ', u'നിങ്ങടെ'), | |
(ur'നിയബ്ദ', u'നീശ്ശബ്ദ'), | |
(ur'നിളിൽ ', u'നങ്ങളിൽ '), | |
(ur'നിളും', u'നങ്ങളൂം'), | |
(ur'നേത്രിള', u'നേത്രങ്ങള'), | |
(ur'പഘാത്ത', u'പശ്ചാത്ത'), | |
(ur'പിയാത്തി', u'പിശ്ശാത്തി'), | |
(ur'പരൌ', u'പൗര'), | |
(ur'പ്രായഘിത്ത', u'പ്രായശ്ചിത്ത'), | |
(ur'ഭർവന', u'ഭർത്സന'), | |
(ur'ഭീം', u'ഭീഷ്ട'), | |
(ur'ഭൽൻ', u'ഭക്തൻ'), | |
(ur'ഭൽന്റെ', u'ഭക്തന്റെ'), | |
(ur'ഭതൌ', u'ഭൗത'), | |
(ur'ഭമൌ', u'ഭൗമ'), | |
(ur' മാർന', u' മാർഗ്ഗ'), | |
(ur'മാർപ്പാര', u'മാർജ്ജാര'), | |
(ur'മേഘി', u'മേഘങ്ങ'), | |
(ur'മനൌാ', u'മൗനാ'), | |
(ur'യിൾ ', u'യങ്ങൾ '), | |
(ur'യുദ്ധൊ', u'യുമൊ'), | |
(ur'യുദ്ധോ', u'യുമോ'), | |
(ur'യോമാവ', u'യോദ്ധാവ'), | |
(ur'ല1', u'ലങ്ക'), | |
(ur'രിൾ', u'രങ്ങൾ'), | |
(ur'രൂപിൾ', u'രൂപങ്ങൾ'), | |
(ur'വവാ', u'വത്സാ'), | |
(ur' വവൻ', u' വത്സൻ'), | |
(ur' വർന', u' വർഗ്ഗ'), | |
(ur'വാവല്യ', u'വാത്സല്യ'), | |
(ur'വിരുമ', u'വിരുദ്ധ'), | |
(ur'വിഷആ', u'വിഷണ്ണ'), | |
(ur'വ്യിള', u'വ്യങ്ങള'), | |
(ur'ശജ്ഞ', u'ശയ്യ'), | |
(ur'ശര്യൌ', u'ശൗര്യ'), | |
(ur'സഗ്ന', u'സന്ധ'), | |
(ur'സന്തും', u'സന്തുഷ്ട'), | |
(ur'സന്ദിഗ്മ', u'സന്ദിഗ്ദ്ധ'), | |
(ur'സ1തേ', u'സങ്കേത'), | |
(ur'സിമമ', u'സിദ്ധമ'), | |
(ur'സധൌ', u'സൗധ'), | |
(ur'സഭൌാ', u'സൗഭാ'), | |
(ur'സഹൌാ', u'സൗഹാ'), | |
(ur'സ്പംമാ', u'സ്പഷ്ടമാ'), | |
(ur'സ്വർന', u'സ്വർഗ്ഗ'), | |
(ur'ളിൾ', u'ളങ്ങൾ') | |
] | |
} |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment