വിക്കിഗ്രന്ഥശാലയിലെ ഡിജിറ്റൈസേഷന്‍

വിക്കിഗ്രന്ഥശാലയിലെ പുതിയ ഡിജിറ്റൈസിങ് സങ്കേതത്തെ പരിചയപ്പെടുത്തുന്നതാണ് ഈ പോസ്റ്റ്. ഇംഗ്ലീഷ് വിക്കിസോഴ്സിലും മറ്റും വളരെയധികം ഉപയോഗിക്കുന്ന ഈ രീതി പക്ഷേ ഇതരഭാഷാ വിക്കികളില്‍ വളരെ കുറവേ കാണുന്നുള്ളൂ. അതത് ഭാഷകള്‍ക്കുള്ള OCR സംവിധാനത്തിന്റെ അപര്യാപ്തതയാണ് ഇതിന് കാരണം.  മലയാളം OCR ന്റെ വികസനത്തിനും ഈ വിക്കി ഗ്രന്ഥശാലാ  പദ്ധതികള്‍ ഉപകരിക്കുമെന്ന്  പ്രതീക്ഷിക്കുന്നു.

വിക്കിഗ്രന്ഥശാലയില്‍ എന്ത് ചെയ്യാനാകും. എങ്ങനെ സഹായിക്കാനാകും എന്ന് ചിന്തിച്ച് നില്ക്കുന്നവര്‍ക്ക് ഈ പോസ്റ്റ് സഹായിക്കും എന്ന് കരുതുന്നു.

സാധാരണ ഉപയോഗിക്കുന്ന പിഡിഎഫ് ഫോര്‍മാറ്റിന് പകരം ദേജാവൂ എന്ന സ്വതന്ത്ര ഫോര്‍മാറ്റാണ് സ്കാന്‍ ചെയ്ത പുസ്തകത്തിന് ഉപയോഗിക്കുന്നത്. ഇത് എങ്ങനെ ഉണ്ടാക്കാം/പിഡിഎഫിനെ രൂപമാറ്റം നടത്തിയെടുക്കാം എന്ന് ഇവിടെ [S:Help:DjVu_files] നിന്നും മനസ്സിലാക്കാം.

ഒരോ പുസ്തകത്തിന്റേയും സൂചുകാ (ഇന്റക്സ്) പേജിലാണ് ഡിജിറ്റൈസേഷന്റെ അവസ്ഥ മനസ്സിലാക്കാന്‍ കഴിയുക.

ദൂതവാക്യം ഗദ്യം എന്ന പുസ്തകത്തിന്റെ സ്ക്രീന്‍ഷോട്ടുകള്‍ ശ്രദ്ധിക്കുക.

സൂചികാ താള്‍ (ദൂതവാക്യം ഗദ്യം)

ചുവന്ന വൃത്തത്തില്‍ കാണിച്ചിരിക്കുന്ന താളുകള്‍ എന്ന വിഭാഗത്തില്‍ ഓരോ താളുകളുടേയും അവസ്ഥ കാണാം.ഓരോ നിറങ്ങളും ഓരോ അവസ്ഥയെ സൂചിപ്പിക്കുന്നു.

ചുവന്ന ലിങ്കുകള്‍ ശൂന്യമായ താളുകളാണ്. അവ ടൈപ്പ് ചെയ്ത് സൃഷ്ടിക്കേണ്ടിയിരിക്കുന്നു.
തെറ്റുതിരുത്തൽ വായന നടന്നിട്ടില്ലാത്തവ
തെറ്റുതിരുത്തൽ വായന കഴിഞ്ഞവ
സാധുകരിച്ചവ (2 പ്രാവശ്യം തെറ്റുതിരുത്തല്‍ വായന കഴിഞ്ഞവ)
എഴുത്ത് ഇല്ലാത്തവ 
പ്രശ്നമുള്ളവ

ഇതില്‍ നിന്നും പ്രൂഫ് റീഡ് ചെയ്യാന്‍ താല്പര്യമുള്ളവര്‍ക്ക് റോസ് നിറത്തിലുള്ള പേജുകളിലേയ്ക്ക് പോകാം. ടൈപ്പ് ചെയ്യേണ്ടവര്‍ക്ക് ചിവന്ന ലിങ്കുകളില്‍ ക്ലിക്ക് ചെയ്ത് അതത് താളുകള്‍ സൃഷ്ടിക്കാം.

 

ഒരു താള്‍ തുറന്നാല്‍ കാണുന്നതിന്റെ മാതൃകയാണ് താഴെ.

ഒരു താളിന്റെ ഘടന

വലത് ഭാഗത്ത് കറുത്ത വൃത്തത്തില്‍ കാണുന്നതാണ് സ്കാന്‍ ചെയ്ത പേജിന്റെ ചിത്രം. ഇടത് ഭാഗത്തായി ടൈപ്പ് ചെയ്യാനുള്ല ഒരു സ്ഥലം കാണാം. സാധാരണ വിക്കിയുടെ പണിയിടം പോലെ തന്നെ. മഞ്ഞ ചതുരത്തില്‍ ഉപയോഗിക്കാവുന്ന ഫോര്‍മാറ്റിങ് ടൂളുകളും കാണാം. ഗ്രന്ഥശാലയില്‍ ഇത് വല്ലപ്പോഴുമേ ആവശ്യം വരാറുള്ളൂ.

വലതുഭാഗത്തെ ചിത്രത്തില്‍ കാണുന്ന അക്ഷരങ്ങള്‍ ഇടത് ഭാഗത്ത്  ടൈപ്പ് ചെയ്യുക മാത്രമാണ് ജോലി. പേജ് സൃഷിക്കാന്‍ നേരത്ത് ഇംഗ്ലീഷ് അക്ഷരങ്ങള്‍ കാണുന്നുണ്ടെങ്കില്‍ അതെല്ലാം ഡെലിറ്റ് ചെയ്ത് കളയുക. വിക്കിയിലെ OCR സംവിധാനം പ്രവര്‍ത്തിച്ച് കിട്ടുന്ന അക്ഷരങ്ങളാണിതെല്ലാം. മലയാലത്തിന് ഇത് ഉപകാരമായിട്ടില്ല.

ഇനി സേവ് ചെയ്യുന്നതിന് മുമ്പായി താളിന്റെ തല്സ്ഥിതി എന്നതിലെ കളര്‍ ബട്ടണുകള്‍ തിരെഞ്ഞെടുക്കണം.(നേരത്തെ പറഞ്ഞ കളറുകള്‍ തന്നെ) ആ റേഡിയോ ബട്ടണ്‍ ഞെക്കുമ്പോല്‍ ചുരുക്കം   എന്ന കള്ളിയില്‍ അതിനനുയോജ്യമായ വാചകം വന്നിട്ടുണ്ടെന്ന് ഉറപ്പുവരുത്തു താള്‍ സേവ് ചെയ്യക എന്നത് ക്ലിക്ക് ചെയ്യുക.

ഇത്രേ ഉള്ളൂ കാര്യം. വളരെ എളുപ്പത്തില്‍ എല്ലാവര്‍ക്കും ചെയ്യാവുന്ന കാര്യമാണ്. മലയാളം ടൈപ്പിങ്ങ് അറിയാമെങ്കില്‍ ചിലവിടാന്‍ കുറച്ച് സമയമുണ്ടെങ്കില്‍ ആര്‍ക്കും ചെയ്യാവുന്ന ഒരു കാര്യമാണ്. നമ്മുടെ കഴിഞ്ഞ കാലത്തെ അമൂല്യ ഗ്രന്ഥങ്ങള്‍ സൂക്ഷിച്ച് ഡിജിറ്റല്‍ രൂപത്തില്‍ സൂക്ഷിച്ച് വയ്ക്കേണ്ടത് ഓരോരുത്തരൂടേയും കടമയാണ്. ഇത്തിരി സമയം കിട്ടിയാല്‍ ഇവിടെയെത്തി രണ്ട് പേജ് പ്രൂഫ് വായിക്കാനോ ഒരു പേജ് ടൈപ്പ് ചെയ്യാനോ അധികം ബുദ്ധിമുട്ട് ആര്‍ക്കും ഉണ്ടാവിലെന്ന് കരുതുന്നു. ഇതുപോലെ നൂറുകണക്കിന് ആളുകളുടെ ശ്രമഫലമായിട്ടാണ് വിക്കിഗ്രന്ഥശാല ഈ വിധം വളര്‍ന്നത്.

ഭാഷെയെ സ്നേഹിക്കുവെങ്കില്‍ നിങ്ങളും ഇതില്‍ പങ്കാളിയാണെന്ന് ഉറപ്പുവരുത്തുക. അഭിമാനിക്കുക. :)

ഓഫ് ലൈനായി ഇത് ചെയ്യാനാകുമോ ?

ഇതിനെ വിക്കിഗ്രന്ഥശാല പ്രോത്സാഹിപ്പിക്കുന്നില്ല. കാരണമെന്തെന്നാല്‍ ഓഫ്ലൈനായി ടൈപ്പ് ചെയ്ത് വിക്കിയില്‍ ചേര്‍ക്കാന്‍ വര്മ്പോഴേക്കും വേറെ ആരെങ്കിലും അത് ചെയ്യാന്‍ സാധ്യതയുണ്ട്. ഡ്യൂപ്ലിക്കേഷന്‍ നടന്നേക്കാം . എന്നിരുന്നാലും ഞാന്‍ ഈ താള്‍ ടൈപ്പ് ചെയ്യുന്നു എന്ന് പ്രസ്തുത താളിലോ അല്ലെങ്കില്‍ അതിന്റെ സംവാദം താളിലോ കുറീപ്പായി ഇട്ട് ഓഫ്ലൈനായി ടൈപ്പ് ചെയ്യാവുന്നതാണ്.  ഏറ്റവും മുകളില്‍ ചിത്രം എന്നതില് ക്ലിക്ക് ചെയ്താല്‍ അതിന്റെ ചിത്രരൂപം ഡൗണ്‍ലോഡ് ചെയ്തെടുക്കാവുന്നതാണ്. ഓഫ്ലൈനായി ടൈപ്പ് ചെയ്ത ശേഷം എത്രയും വേഗത്തില്‍ അത് വിക്കിയിലോട്ട് പുതുക്കുക.

പകര്‍പ്പാവകാശം കഴിഞ്ഞ പുസ്തങ്ങള്‍ കയ്യിലുണ്ട്. 

പകര്‍പ്പാവകാശം കഴിഞ്ഞ പുസ്തങ്ങളുടെ സ്കന്‍ ചെയ്തോ/ഫോട്ടോ എടുത്തോ  സംഭാവന ചെയ്യാനാകുമെങ്കില്‍ http://groups.google.com/group/mlwikilibrarians എന്ന ഗൂഗിള്‍ ഗ്രൂപ്പുമായി ബന്ധപ്പെടുക. സ്കാന്‍ ചെയ്യുകയാണെങ്കില്‍ 300dpi യില്‍ സ്കാന്‍ ചെയ്യുന്നത് ഉചിതം. ഭാവിയിലെ OCR പരീക്ഷണങ്ങള്‍ക്ക് സഹായിച്ചേക്കും. ഗ്രന്ഥശാലയില്‍ വായിക്കാനാകുന്ന ക്ലാരിറ്റിയിലുള്ള സ്കാനുകള്‍ ആയാലും മതിയാകും.  വിക്കി ഗ്രന്ഥശാലയിലോ വിക്കിമീഡീയ കോമണ്‍സിലോ ഇത് അപ്ലോഡ് ചെയ്യാവുന്നതാണ്.

ടൈപ്പ് ചെയ്യാനുള്ള പുസ്തകങ്ങളുടെ പട്ടിക എവിടെ കിട്ടും ?

djvu ഫോര്‍മാറ്റില്‍  സ്കാന്‍ ചെയ്ത് ടൈപ്പിങ്ങിന് റെഡിയായി നില്ക്കുന്ന പുസ്തകങ്ങളുടെ പട്ടിക http://ml.wikisource.org/wiki/Special:IndexPages
വിക്കിഗ്രന്ഥശാലയിലെ വിവിധപദ്ധതികളെകുറിച്ചുള്ള വിവരങ്ങള്‍ വിക്കിഗ്രന്ഥശാല:വിക്കിപദ്ധതി

ദേജാവൂ രീതിയില്‍ ഡിജിറ്റൈസ് ചെയ്ത ചില പുസ്തകങ്ങള്‍

സംശയങ്ങളുണ്ടെങ്കില്‍ വിക്കിഗ്രന്ഥശാലയില്‍ സംവാദം താളുകളിലോ വിക്കിഗ്രന്ഥശാലയുടെ ഗൂഗില്‍ ഗ്രൂപ്പിലോ ചോദിക്കുക.

ഒരു നല്ല വിക്കിഗ്രന്ഥശാല അനുഭവം ആശംസിച്ചുകൊണ്ട്, സസ്നേഹം –മനോജ്‌ .കെ 01:30, 1 ഒക്ടോബര്‍  2011 (UTC)

CC BY-SA

ഈ പോസ്റ്റ്  ക്രിയേറ്റീവ് കോമൺസ് ആട്രിബ്യൂഷൻ/ഷെയർ-എലൈക്ക് അനുമതിപത്ര (കടപ്പാട്, സമാനമായ അനുമതിപത്രം, എന്നിവ നൽകുക)  പ്രകാരം പ്രസിദ്ധീകരിച്ചിരിക്കുന്നു.

8 thoughts on “വിക്കിഗ്രന്ഥശാലയിലെ ഡിജിറ്റൈസേഷന്‍

    1. manojkmohan Post author

      നാള് കുറച്ചായി ഡ്രാഫ്റ്റില്‍ കിടക്കുന്നു. അന്ന് രാത്രി സുഗീഷണ്ണന് ചെയ്തിട്ട് മനസ്സിലാകുന്നില്ല എന്ന് പറഞ്ഞപ്പൊ എഴുതി തുടങ്ങീതാ. ഇപ്പഴാ കഴിഞ്ഞെ. ഇനി നേരെ പോയി രണ്ട് പേജ് ടൈപ്പ് ചെയ്തേ.

      Reply
  1. Pingback: Digitization of books in Wikisource using DjVu | abundance of the heart

  2. Pingback: വായിച്ചാലും വായിച്ചാലും തീരാത്ത പുസ്തകം | സപര്യ

  3. Pingback: കെ.വേണുവിന്റെ പ്രപഞ്ചവും മനുഷ്യനും സ്വതന്ത്ര ലൈസന്‍സില്‍ | സപര്യ

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>