11 నవంబర్ 2011 శుక్రవారం

గూగులుకు తెలుగు నేర్పాలి మనం!

తెలుగులో పదాలను వాక్యంలో ఇమిడ్చేటపుడు అవి రూపం కోల్పోతూ ఉంటాయి. సంధి జరిగి, సమాసం ఏర్పడినపుడు, బహువచనాలైనపుడు, విభక్తులు చేరినపుడు, .. ఇలా అనేక రకాలుగా పదాల రూపు మారుతూంటుంది. క్రియా రూపాలను బట్టి మారడం సరేసరి! ఇంగ్లీషులోనూ మారతాయిగానీ, తెలుగులో మారినంత ఎక్కువగా ఆ భాషలో జరగదు. పైగా ఇంగ్లీషులో జరిగే మార్పులు కొన్ని ఖచ్చితమైన నియమాలకు లోబడి జరుగుతాయి. ఆ నియమాలు కూడా తక్కువే. తెలుగులోనూ నియమాలున్నాయి గానీ, అవి చాలా ఎక్కువ.


ఇంగ్లీషు పదాల కోసం గూగిలించేటపుడు గూగులుకు ఈ నియమాలన్నీ తెలుసు కాబట్టి, అది సంబంధిత రూపాలన్నిటినీ చూపిస్తుంది. థీవ్స్ కోసం వెతికితే థీఫ్, థెఫ్ట్ ల కోసం కూడా వెతుకుతుంది. గూగులుకు వీటిని నేర్పించారు. అదే పద్ధతిలో దొంగలు అనే తెలుగు పదం కోసం వెతికితే దొంగతనము అనే పదం మాత్రమే ఉన్న సైట్లను చూపించదు.

మాటలకు విభక్తి ప్రత్యయాలను చేర్చినపుడు వాటిని పదానికి కలిపేసి రాస్తాం మనం. అలాగే రాయాలి అను అనుకుంటాన్నేను! అంటే తెలంగాణలో అనే మాటను "తెలంగాణలో" అనే రాస్తాం, "తెలంగాణ లో" అని రాయం. ఏదైనా అరుదైన, ప్రత్యేక సందర్భముంటే తప్ప ఈ రెండూ ఒకటే! కానీ గూగులు అలా అనుకోదు."తెలంగాణ" కోసం వెతికితే "తెలంగాణలో" అనే పదమున్న సైట్లు కనిపించవు.

అలాగే సంధులు కూడా- రెండు పదాలు కలిసి సంధి ఏర్పడి ఒకే పదంగా మారతాయి. పదాలు అసలు స్వరూపం కోల్పోతాయి. కైపెక్కి, "కైపు ఎక్కి: అనే రెండు పదాల కోసం వెతికితే సంగతి అర్థమౌతుంది. రెంటినీ దాదాపుగా ఒకే అర్థంలో వాడతాం. అంత మాత్రాన ప్రతీ సంధినీ అలా భావించడానికి కూడా లేదు. ఉదాహరణకు "కొండ ఎక్కింది", "కొండెక్కింది" అనే రెండు పదాలు చూడండి.. కొండెక్కింది అనే పదం కొండ ఎక్కింది అనే సూటి అర్థంలోనే కాకుండా ఆరిపోయింది, ముగిసింది అనే అర్థంలో జాతీయంగా కూడా వాడతాం.

ఇక, గ్రాంథికం, వ్యావహారికం, శిష్టవ్యావహారికం, మాండలికాలు -ఇలాంటి అనేక రూపాలు కూడా ఉన్నాయి. "ఉన్నాయి" అనే మాటను ఉన్నవి, ఉండెను, కలవు, ఉన్నవి, ఉన్నయి, ఉండినాయి, లాంటి అనేక రూపాల్లో రాస్తాం. ఉన్నై అనికూడా రాస్తారు. నేనూ రాస్తూంటాను. ’చేరా’ పుస్తకంలో ఆయన అలా రాయడం చూసాను.

ఇన్నేసి రకాలుగా రాస్తూంటే వీటికోసం వెతికే గూగులుకు ఈ సంగతి తెలియాలి కదా! ఇవన్నీ ఒకటేనమ్మా అని, ఇదిగో, ఇవి మాత్రం వేరువేరులే అనీ.. నేర్పాలి కదా! ఎవరు నేర్పాలి? తెలుగు వచ్చిన వాళ్ళు, గూగులుకు ఎలా నేర్పాలో తెలిసినవాళ్ళూ "కలిసి" నేర్పాలి. ఈ రెండు వర్గాల ప్రజలు కలిసేది అంతర్జాలంలోనే కాబట్టి,  ఆ పని ఇక్కడే జరగాలి. తెలుగు భాష గురించి పట్టించుకునేవాళ్ళు, ప్రభుత్వం, ప్రభుత్వ సంస్థలు, పరిశోధనా సంస్థలు, ఈతెలుగు వంటి సంస్థలు, విశ్వవిద్యాలయాలూ వంటి అందరూ తెలుగును గూగుల్ వంటి ఆధునిక సాంకేతిక పరికరాలకు నేర్పే దిశగా కృషి చెయ్యాలి.  తెలుగును ఆధునికీకరించడంలో భాషలో మార్పుచేర్పులు చేసుకోవడమే కాదు, ఇది కూడా ఒక భాగమే!

భాషను గూగుల్లాంటి యంత్రాలకు నేర్పడం కోసం కొన్ని నియమాలను తయారు చేసుకోవాలి. ఈ పని చెయ్యడానికి తెలుగు బ్లాగరులకు, తెలుగులో కంప్యూటరును వాడేవాళ్లకు ఉన్నంత వీలు, ఉన్నన్ని వసతులూ ఎవరికీ లేవని నా ఉద్దేశం. అందరూ కలిసి ఉమ్మడిగా పనిచేస్తే ఈ పని తేలిగ్గా సాధించవచ్చు. తెలుగుపై సాధికారికత ఉన్నవాళ్ళు, తెలుగు సంస్థలలో పనిచేస్తూ ఇతర సంస్థలతో సంబంధాలు నెరపుతున్నవాళ్ళు కూడా బ్లాగరులలో ఉన్నారు. వాళ్ళు నేతృత్వం వహించి ఈ పనికి పూనుకోవాలి.

.................

ఇలాంటి విషయమ్మీద నేను రాసిన తెలుగులో వెతకటం అంత వీజీ కాదు గురూ అనే టపా కూడా చూడండి.

16 వ్యాఖ్యలు:

  1. This is a nice post. Thanks for bringing out these important issues. After receiving a hint from a friend, Nagaraju Pappu, I wanted to share with the readers about related technology developed by SETU Software Systems, which is a start-up incubated in IIIT Hyderabad (www.setusoftware.com). Its first product is related to Indian language search. Rediff.com licensed that product and made it available at http://ilsearch.rediff.com - check its Telugu search.

    This search technology is based on several years of research in processing agglutinative languages like Telugu. In agglutinative languages Sandhi and Samasa results in very productive formation of individual words resulting in almost infinite variations - precisely the problem you have pointed out in this blog as well as an earlier blog (తెలుగులో వెతకటం అంత వీజీ కాదు గురూ).

    SETU applied its solution to provide search in major Indian languages through rediff.com as well as its own portal (www.setooz.com) for many world languages sharing similar phenomenon. Those who are interested in looking at the research findings may look at http://web2py.iiit.ac.in/research_centres/publications/view_publication/phdthesis/1

    SETU is also currently working with some Indian language media publication houses to help them with language tools like spell checking, grammar checking, word variations, finding right Indian language substitutions for English/other foreign words and so on.

    Thanks,
    --Vasudeva Varma

    ప్రత్యుత్తరంతొలగించు
  2. చదువరి గారూ
    ఇంత అవగాహనతో శ్రద్ధతో రాసిన మీరే ఆ పని మొదలు పెట్టకూడదూ...(తిట్టుకోకండి).
    మేం చేయగలిగిన సాయం చేస్తాం కదా...మనందరి తెలుగు కోసం...
    మల్లీశ్వరి.

    ప్రత్యుత్తరంతొలగించు
  3. చాలా బాగా ఎనలైజ్ చేసారు. మనం దీని కోసం కూడా ఒక తెలుగు గుంపును ఏర్పాటు చేసుకుంటే బాగుంటుంది కదా!

    ప్రత్యుత్తరంతొలగించు
  4. వాసుదేవ వర్మ గారూ,
    మీ వ్యాఖ్యలు, లింకులు ఉండటాన కాబోలు, స్పాము లోకి పోయాయి. నేను గమనించుకోలేదు. ఇప్పుడే చూసి ప్రచురించాను. ఆలస్యానికి మన్నించండి.

    చక్కటి సమాచారం ఇచ్చారు. http://ilsearch.rediff.com/ ను పరిశీలిస్తాను.

    ప్రత్యుత్తరంతొలగించు
  5. మల్లీశ్వరి: :) నిజానికి ఎలా చెయ్యాలో నాకు తెలవదండి. వాసుదేవవర్మ గారు కొంత పని చేసారు, చూసారు గదా! కొందరు ఔత్సాహికులు కూడా ఈ పని గురించి ఆలోచిస్తున్నారు. చూద్దాం.. ఏమౌతుందో!
    జ్యోతిర్మయి: నెనరులండి.
    కార్తిక్: తెలుగు పదం గుంపులో దీని గురించి కూడా చర్చ నడపవచ్చేమోనండి.

    ప్రత్యుత్తరంతొలగించు
  6. శిరిష్ కుమార్ గారూ నూతన సంవత్సర శుభాకాంక్షలు సార్! మీ టపా కోసం ఎదురుచూస్తున్నా!

    ప్రత్యుత్తరంతొలగించు
  7. చదువరీ,
    తదుపరి టపాలకై ఎదురు చూస్తూ......


    కాముధ

    ప్రత్యుత్తరంతొలగించు
  8. శిరీష్ గారూ,


    చాలా రొజులగా మీ టపాలు లేక్ మన బ్లాగ్లోకం వెల వెల పోతోంది. ఆమధ్యన జనవరి లో నాగమురళి గారి బ్లాగ్ లొ ఒకసారి కమెంటారు. తరువాత ఎక్కడా కనబడ్లేదు.

    మీ ఆరొగ్యం బాగుందని తలుస్తాను. మీ శైలి లొ ఓ మంచి టపాకైెదురుచూస్తూ,

    కాముధ

    P.S: ఈమద్య మీగుంటూరునుంచే యరమణ గారు పనిలేక బ్లాగ్ లొ వైవిధ్యమైన టపాలు పెడుతున్నారు చూస్తున్నారా.

    ప్రత్యుత్తరంతొలగించు
  9. కాముధ గారూ, ఆరోగ్యానికేమీ ఢోకా లేదండి, టైమే దొరకటం లేదు. రాయాల్సిన సంగతులు కూడా మెండుగానే వస్తున్నై గానీ, కుదరక రాయటం లేదు. :)

    యరమణ గారి బ్లాగు చూస్తూంటాను. నా కిష్టమైన బ్లాగది.

    ప్రత్యుత్తరంతొలగించు
  10. How loooooooooooooooooooooooooooooooooooooooooooooooooooooooong should we wait to see your post????

    ప్రత్యుత్తరంతొలగించు
  11. చాల బావుంది, గూగుల్ కి తెలుగు నేర్పడం చాల మంచి ఆలోచన....

    ప్రత్యుత్తరంతొలగించు
  12. ఆడియో బుక్స్ తెలుగులో విస్త్రుతముగా రావాల్సిన అవసరం గురించి కూడా బ్లాగులొ రాయండి.
    మొబైల్లో తెలుగు సాహిత్యం వినడం బాగుంటుంది.

    ప్రత్యుత్తరంతొలగించు

సంబంధిత టపాలు