Skip to content

Instantly share code, notes, and snippets.

@vssun
Created February 20, 2012 03:44
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save vssun/1867654 to your computer and use it in GitHub Desktop.
Save vssun/1867654 to your computer and use it in GitHub Desktop.
replace.py fixes for dharmaraja ascii convertion
# -*- coding: utf-8 -*-
#
# This is only an example. Don't use it.
# version: 2.0
fixes['wikisource'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു',
},
'replacements': [
(ur'അിനെ', u'അങ്ങനെ'),
(ur'അിോ', u'അങ്ങോ'),
(ur'ആഘര്യ', u'ആശ്ചര്യ'),
(ur'ഇി', u'ഇങ്ങ'),
(ur'ഈിാ', u'ഇങ്ങോ'),
(ur'ഈപ്പാ', u'ഇപ്പോ'),
(ur'ഉവാഹ', u'ഉത്സാഹ'),
(ur' ദ്ദർപ്പി', u' ഊർജ്ജി'),
(ur' ദ്ദ', u' ഊ'),
(ur'എിനെ', u'എങ്ങനെ'),
(ur' ̈', u' ഓ'),
(ur' ാെ', u'ക്കൊ'), #ഇതിന്റെ ക്രമം മാറ്റരുത്.
(ur' ാ', u'ക്കാ'),
(ur' ി', u'ക്കി'),
(ur' ു', u'ക്കു'),
(ur' ൂ', u'ക്കൂ'),
(ur' ്', u'ക്ക്'),
(ur' ൃ', u'ക്കൃ'),
(ur' ം', u'ക്കം'),
(ur' ̧', u'ക്ഷ'), #ശരിയല്ല.
(ur'ിിനെ', u'ിങ്ങനെ'),
(ur'ിിൾ', u'ിങ്ങൾ'),
(ur'ിാ', u'ങ്ങാ'),
(ur'ിി', u'ങ്ങി'),
(ur'ിീ', u'ങ്ങീ'),
(ur'ിു', u'ങ്ങു'),
(ur'ി്', u'ങ്ങ്'),
(ur'ിേ', u'ങ്ങേ'),
(ur'1ി', u'ങ്കി'),
(ur'ചെജ്ഞ', u'ചെയ്യ'),
(ur'1⁄4',u'ഞ്ഞ'),
(ur'1⁄ൽ', u'ട്ട'),
(ur'ൾ⁄4', u'ണ്ട'),
(ur'ൾെ⁄4', u'ണ്ടെ'),
(ur'ൾേ⁄4', u'ണ്ടേ'),
(ur'ൾേ⁄4ാ', u'ണ്ടോ'),
(ur'ആാ', u'ണ്ണാ'),
(ur'ആെ', u'ണ്ണെ'),
(ur'ആു', u'ണ്ണു'),
(ur'ആം ', u'ണ്ണം '),
(ur'ഝ്യ', u'ത്ഥ്യ'),
(ur'ദഹൌിത്രി', u'ദൗഹിത്രി'),
(ur'നിഘയ', u'നിശ്ചയ'),
(ur'ഌ', u'നീ'),
(ur' ബമ', u' ബദ്ധ'),
(ur'ബുമി', u'ബുദ്ധി'),
(ur'ബോമ്യ', u'ബോദ്ധ്യ'),
(ur'ബ്ര1', u'ബ്രഹ്മ'),
(ur'ബ്രാ1ണ', u'ബ്രാഹ്മണ'),
(ur'യ്വ', u'യ്‌വ'),
(ur'വൃമ', u'വൃദ്ധ'),
(ur'ംി', u'ഷ്ടി'),
(ur'ംീ', u'ഷ്ടീ'),
(ur'ർഎ', u'ർവ്വ'),
(ur'ർർ', u'ർച്ഛ'),
#രണ്ടാംഘട്ടം
(ur'ൽി', u'ക്തി'),
# (ur'1',u'ങ്ക') ഉപയോഗിക്കാനാകില്ല.
]
}
fixes['wikisource2'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു',
},
'replacements': [
(ur'അണ്ണാവജ്ഞ', u'അണ്ണാവയ്യ'),
(ur'ആി', u'ണ്ണി'),
(ur'അമ്യ', u'അദ്ധ്യ'),
(ur'ക്ക്̧', u'ക്ഷ്'), #check whether it is working well
(ur'ർാ', u'ച്ഛാ'),
(ur'ബഗ്ന', u'ബന്ധ'),
(ur'രഡി', u'രത്നങ്ങ'),
(ur'രഡ', u'രത്ന'),
(ur'ശുമി', u'ശുദ്ധി'),
(ur'ഫോക', u'ശ്ലോക'),
(ur'ംാ', u'ഷ്ടാ'),
(ur'സന്നമ', u'സന്നദ്ധ'),
(ur'സിമി', u'സിദ്ധി'),
(ur'ർഝ', u'ർത്ഥ'),
(ur'ർആ', u'ർണ്ണ')
]
}
fixes['wikisource3'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-3',
},
'replacements': [
(ur'ഈദ്ദ', u'ഇദ്ദേ'),
(ur'ഊദ്യാ', u'ഉദ്യോ'),
(ur'ഊദ്ദശ', u'ഉദ്ദേശ'),
(ur' ീ', u'ക്കീ'),
(ur'1ാ', u'ങ്കാ'),
(ur'1ു', u'ങ്കു'),
(ur'ആേ', u'ക്ലേ'),
(ur'പ്രഢൌ', u'പ്രൗഢ'),
(ur'പ്രസിമ', u'പ്രസിദ്ധ'),
(ur'രാമജ്ഞ', u'രാമയ്യ'),
(ur'സന്ദൌ', u'സൗന്ദ'),
(ur'ർമന', u'ർദ്ധന')
]
}
fixes['wikisource4'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-4',
},
'replacements': [
(ur'അർന', u'അച്ഛന'),
(ur'അർൻ', u'അച്ഛൻ'),
(ur'അന്തർനത', u'അന്തർഗ്ഗത'),
(ur'അർമ', u'അർദ്ധ'),
(ur'അജ്ഞോ', u'അയ്യോ'),
(ur'ഈല്ല', u'ഇല്ലേ'),
(ur'ഉപ്പ്വലി', u'ഉജ്ജ്വലി'),
(ur'ഉമാരണ', u'ഉദ്ധാരണ'),
(ur' ങ്കശ്വര്യ', u' ഐശ്വര്യ'),
(ur'ഔര', u'ഒരേ'),
(ur' ഞ്ച', u' ഔ'),
(ur'കുപ്പയാ', u'കുപ്പശ്ശാ'),
(ur'ിോ', u'ങ്ങോ'),
(ur' ഞിൾ', u' ഞങ്ങൾ'),
(ur' ഞിള', u'ഞങ്ങള'),
(ur'ആീ', u'ണ്ണീ'),
(ur'ദുംത', u'ദുഷ്ടത'),
(ur'നിഘല', u'നിശ്ചല'),
(ur'നേത്രിൾ', u'നേത്രങ്ങൾ'),
(ur'ബമ', u'ബദ്ധ'),
(ur' ഭൽ', u' ഭക്ത'),
(ur'യീലം', u'ശ്ശീലം'),
(ur'യവൌ', u'യൗവ'),
(ur'വർമി', u'വർദ്ധി'),
(ur'വാർമക്യ', u'വാർദ്ധക്യ'),
(ur'സഭൌ', u'സൗഭ'),
(ur'ർപ്പുന', u'ർജ്ജുന'),
(ur'ർണ്ണിള', u'ർണ്ണങ്ങള')
]
}
fixes['wikisource5'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-5',
},
'replacements': [
(ur'ാേ', u'ോ'),
(ur'ിൾക്ക്', u'ങ്ങൾക്ക്'),
(ur'ിെ', u'ങ്ങെ'),
(ur'കംം', u'കഷ്ടം'),
(ur' കംമ', u'കഷ്ടമ'),
(ur'കതൌുക', u'കൗതുക'),
(ur'കശൌ', u'കൗശ'),
(ur' ൾ', u'ക്കൾ'),
(ur'ൽാ', u'ക്താ'),
(ur'ൽ്', u'ക്ത്'),
(ur'ൽം', u'ക്തം'),
(ur'ക്ഷാേ', u'ക്ഷോ'),
(ur'ഗഗ്ന', u'ഗന്ധ'),
(ur'ഗർപ്പി', u'ഗർജ്ജി'),
(ur'1ീ', u'ങ്കീ'),
(ur'ഢുത', u'ത്ഭുത'),
(ur'തജ്ഞാറ', u'തയ്യാറ'),
(ur'നങ്ങിള', u'നീങ്ങള'),
(ur'പദനാഭ', u'പത്മനാഭ'),
(ur' പുർ', u' പുച്ഛ'),
(ur'പരൌാ', u'പൗരാ'),
(ur'പരൌു', u'പൗരു'),
(ur'ബുമ', u'ബുദ്ധ'),
(ur'മമ്യ', u'മദ്ധ്യ'),
(ur'മാഹാദ', u'മാഹാത്മ'),
(ur'ലിളു', u'ലങ്ങളു'),
(ur'ലകൌി', u'ലൗകി'),
(ur'വ്യൽമാ', u'വ്യക്തമാ'),
(ur' ശുമ', u' ശുദ്ധ'),
(ur'ം്', u'ഷ്ട്'),
(ur'സകൌര', u'സൗകര'),
(ur'സാന്നിമ്യ', u'സാന്നിദ്ധ്യ'),
(ur'സരൌ', u'സൗര')
]
}
fixes['wikisource6'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-6',
},
'replacements': [
(ur'അഗ്നകാര', u'അന്ധകാര'),
(ur'ആദാ', u'ആത്മാ'),
(ur'ഈത', u'ഇതേ'),
(ur' ഉമരി', u' ഉദ്ധരി'),
(ur'ങ്കശ്വര', u'ഐശ്വര'),
(ur'തത്വിൾ', u'തത്വങ്ങൾ'),
(ur'ഭശ്ച', u'ഭഞ്ജ'),
(ur'മശ്ചുള', u'മഞ്ജുള'),
(ur'മറനാ', u'മഗ്നനാ'),
(ur' മാർന', u' മാർഗ്ഗ'),
(ur'യുമ', u'യുദ്ധ'),
(ur' ലപ്പ', u' ലജ്ജ'),
(ur'വിസർന', u'വിസർഗ്ഗ'),
(ur'േഎ', u'വ്വേ'),
(ur'ശിള', u'ശങ്ങള'),
(ur'ശിൾ', u'ശങ്ങൾ'),
(ur'ശുമ', u'ശുദ്ധ'),
(ur'സപൌ', u'സൗപ'),
(ur' സിമ', u' സിദ്ധ'),
(ur'ഹിൾ', u'ഹങ്ങൾ'),
(ur'ർപ്പന', u'ർജ്ജന')
]
}
fixes['wikisource7'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-7',
},
'replacements': [
(ur'ഊപ', u'ഉപേ'),
(ur'കംത', u'കഷ്ടത'),
(ur'ിളേയും', u'ങ്ങളേയും'),
(ur'മേഘിൾ', u'മേഘങ്ങൾ'),
(ur'യുദ്ധായ', u'യുമായ'),
(ur'യുദ്ധി', u'യുമി'),
(ur'യുദ്ധെ', u'യുമെ'),
(ur'ല1ര', u'ലങ്കര'),
(ur'1ം', u'ങ്കം'),
(ur'സ1ൽ', u'സങ്കൽ')
]
}
fixes['wikisource8'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-8',
},
'replacements': [
(ur' ങ്ക', u' ഐ'),
(ur'ംം', u'ഷ്ടം'),
(ur'തി1ൾ', u'തിങ്കൾ'),
(ur'പകടയാല', u'പകടശ്ശാല'),
(ur'മോവാഹി', u'മോത്സാഹി'),
(ur'യ1ര', u'യങ്കര'),
(ur'യുദ്ധ്പ', u'യുമ്പ'),
(ur' വവര', u' വത്സര'),
(ur' വവല', u' വത്സല'),
(ur' വജ്ഞാ', u' വയ്യാ'),
(ur'വിദഗ്മ', u'വിദഗ്ദ്ധ'),
(ur'വൈദഗ്മ്യ', u'വൈദഗ്ദ്ധ്യ'),
(ur'സഗ്ന്യ', u'സന്ധ്യ'),
(ur'സ1ട', u'സങ്കട'),
(ur'സിമന', u'സിദ്ധന'),
(ur'സംഘി', u'സംഘങ്ങ')
]
}
fixes['wikisource9'] = {
'regex': True,
'msg': {
'_default':u'അക്ഷരത്തെറ്റ് ശരിയാക്കുന്നു-9',
},
'replacements': [
(ur'അി', u'അങ്ങ'),
(ur'ആദഗത', u'ആത്മഗത'),
(ur'ആദബലി', u'ആത്മബലി'),
(ur'ആദീയ', u'ആത്മീയ'),
(ur'ആയുധിൾ', u'ആയുധങ്ങൾ'),
(ur'ഊന്മഷ', u'ഉന്മേഷ'),
(ur'കരിളാ', u'കരങ്ങളാ'),
(ur'കാലിളി', u'കാലങ്ങളി'),
(ur'കുട്ടിക്കോന്തിയ', u'കുട്ടിക്കോന്തിശ്ശ'),
(ur' ട്ട', u'ക്കട്ട'),
(ur' ണ', u'ക്കണ'),
(ur'താ1ൾ', u'താങ്കൾ'),
(ur' ച്ച', u'ക്കച്ച'),
(ur' ഥ', u'ക്കഥ'),
(ur' ത്ത', u'ക്കത്ത'),
(ur' പ്പ', u'ക്കപ്പ'),
(ur' യും', u'ക്കയും'),
(ur' ല്ല', u'ക്കല്ല'),
(ur' ള', u'ക്കള'),
(ur' ഴ', u'ക്കഴ'),
(ur' ൽ', u'ക്കൽ'),
(ur' ന്തെു', u'ക്കെന്തു'),
(ur'1ര', u'ങ്കര'),
(ur'1ൂ', u'ങ്കൂ'),
(ur'ഗരൌ', u'ഗൗര'),
(ur'ഗ്രഹിളു', 'ഗ്രഹങ്ങളു'),
(ur'ിളുടെ', u'ങ്ങളുടെ'),
(ur'ിളെ ', u'ങ്ങളെ '),
(ur'ർ്വാ', u'ച്ഛ്വാ'),
(ur'ർി', 'ച്ഛി'),
(ur'ർീ', 'ച്ഛീ'),
(ur'ചെമ്പകയേരി', u'ചെമ്പകശ്ശേരി'),
(ur'ചേംക', u'ചേഷ്ട'),
(ur'ജാലിൾ', u'ജാലങ്ങൾ'),
(ur'ടിൾ', u'ടങ്ങൾ'),
(ur'ണിളിൽ', u'ണങ്ങളിൽ'),
(ur'ണ്ണിൾ', u'ണ്ണങ്ങൾ'),
(ur'ത1', u'തങ്ക'),
(ur'ത്യ്ര', u'ത്ര്യ'),
(ur'ദിൾ ', u'ദങ്ങൾ '),
(ur'ദിളിൽ', u'ദങ്ങളിൽ'),
(ur'ദുയകുന', u'ദുശ്ശകുന'),
(ur'ദുംനെ', u'ദുഷ്ടനെ'),
(ur'ദത്യൌ', u'ദൗത്യ'),
(ur'ദഷ്ട്യൌ', u'ദൗഷ്ട്യ'),
(ur'നിൾ ', u'നങ്ങൾ '),
(ur'നംമാ', u'നഷ്ടമാ'),
(ur'നംവു', u'നഷ്ടവു'),
(ur'നങ്ങിടെ ', u'നിങ്ങടെ'),
(ur'നിയബ്ദ', u'നീശ്ശബ്ദ'),
(ur'നിളിൽ ', u'നങ്ങളിൽ '),
(ur'നിളും', u'നങ്ങളൂം'),
(ur'നേത്രിള', u'നേത്രങ്ങള'),
(ur'പഘാത്ത', u'പശ്ചാത്ത'),
(ur'പിയാത്തി', u'പിശ്ശാത്തി'),
(ur'പരൌ', u'പൗര'),
(ur'പ്രായഘിത്ത', u'പ്രായശ്ചിത്ത'),
(ur'ഭർവന', u'ഭർത്സന'),
(ur'ഭീം', u'ഭീഷ്ട'),
(ur'ഭൽൻ', u'ഭക്തൻ'),
(ur'ഭൽന്റെ', u'ഭക്തന്റെ'),
(ur'ഭതൌ', u'ഭൗത'),
(ur'ഭമൌ', u'ഭൗമ'),
(ur' മാർന', u' മാർഗ്ഗ'),
(ur'മാർപ്പാര', u'മാർജ്ജാര'),
(ur'മേഘി', u'മേഘങ്ങ'),
(ur'മനൌാ', u'മൗനാ'),
(ur'യിൾ ', u'യങ്ങൾ '),
(ur'യുദ്ധൊ', u'യുമൊ'),
(ur'യുദ്ധോ', u'യുമോ'),
(ur'യോമാവ', u'യോദ്ധാവ'),
(ur'ല1', u'ലങ്ക'),
(ur'രിൾ', u'രങ്ങൾ'),
(ur'രൂപിൾ', u'രൂപങ്ങൾ'),
(ur'വവാ', u'വത്സാ'),
(ur' വവൻ', u' വത്സൻ'),
(ur' വർന', u' വർഗ്ഗ'),
(ur'വാവല്യ', u'വാത്സല്യ'),
(ur'വിരുമ', u'വിരുദ്ധ'),
(ur'വിഷആ', u'വിഷണ്ണ'),
(ur'വ്യിള', u'വ്യങ്ങള'),
(ur'ശജ്ഞ', u'ശയ്യ'),
(ur'ശര്യൌ', u'ശൗര്യ'),
(ur'സഗ്ന', u'സന്ധ'),
(ur'സന്തും', u'സന്തുഷ്ട'),
(ur'സന്ദിഗ്മ', u'സന്ദിഗ്ദ്ധ'),
(ur'സ1തേ', u'സങ്കേത'),
(ur'സിമമ', u'സിദ്ധമ'),
(ur'സധൌ', u'സൗധ'),
(ur'സഭൌാ', u'സൗഭാ'),
(ur'സഹൌാ', u'സൗഹാ'),
(ur'സ്പംമാ', u'സ്പഷ്ടമാ'),
(ur'സ്വർന', u'സ്വർഗ്ഗ'),
(ur'ളിൾ', u'ളങ്ങൾ')
]
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment