فرآیند ترجمه

فرآیند ترجمه به شرح زیر است:

رمزگشایی معنایی متن مبدا
کدگذاری دوباره این معنا در زبان مقصد
در پس این فرآیند بظاهر آسان ،عملیات شناختی پیچیده ای واقع است.به منظور رمز گشایی معنای متن مبدا، مترجم باید قابلیت تفسیر و تجزیه تحلیل تمام ویژگی های متن را داشته باشد. یک فرآیند که احتیاج به دانش عمیقی از دستور زبانجمله‌شناسی(نحو)، معناشناسی و اصطلاحات از زبان مرجع دارد به همان اندازه باید دانش مربوط به فرهنگ صحبت کنندگان آن زبان را نیز داشته باشد. از آن جهت، چالشی در ترجمه ماشینی وجود دارد که چگونه یک کامپیوتر را برنامه نویسی کنیم که بتواند همانند یک انسان متنی را بفهمد و بتواند یک متن جدید در زبان مقصد بسازد که بنظر می رسد توسط انسان نوشته شده است. این مساله ممکن است به روشهای مختلفی حل شود. دارالترجمه
روش ها

[تصویر: 300px-Direct_translation_and_transfer_tr...nd.svg.png] [تصویر: magnify-clip.png]
هرمی که عمق های متفاوت نمایش واسط را نشان می دهد. ماشین ترجمه بین زبانی، در نوک هرم است که بدنبال آن ترجمه ی مبتنی بر انتقال و ترجمه مستقیم آمده اند. .


برای دست یافتن به ترجمه ماشینی می توان روشی مبتنی بر قوانین زبان‌شناسی استفاده کرد، به این معنی که کلمات از نظر زبان شناسی ترجمه خواهند شد. (در واقع متناسب ترین کلمات مقصد جایگزین کلمات مبدا خواهند شد.)
این موضوع که موفقیت ترجمه ماشینی پیش از هر چیز نیازمند حل مسئله فهم زبان طبیعی است، اغلب مورد بحث است.به طور عام روش های قانون مند [۱] ،متن را با استفاده از ساختن واسطی سمبلیک -که نهایتا متن زبان مقصد از آن ایجاد می شود- تجزیه می کنند.
با توجه به طبیعت نمایش واسطه، یک روش به عنوان ترجمه ماشینی بین زبانی[۲][۳] معرفی می شود. این روش ها نیاز به واژگانتک‌واژشناسی ، دستور زبان و معناشناسی دارند. یا ترجمه ماشینی مبتنی بر انتقال وسیعی با اطلاعات
با دادن داده های کافی نرم‌افزار های ترجمه ماشینی حتی برای صحبت کننده بومی یک زبان به حدی خوب کار می کنند که معنی تقریبی آنچه توسط یک صحبت کننده بومی دیگر نوشته شده است بفهمد. دشواری کار ترجمه خودکار، بدست آوردن اطلاعات کافی از نوع صحیح آن برای پشتیبانی روشی خاص می باشد.به عنوان مثال یک پیکره وسیع چند زبانی از داده ها، برای روشهای آماری مورد نیاز می باشد.حال آنکه برای روشهای مبتنی بر دستورزبان لازم نیست. اما از سویی دیگر روشهای مبتنی بر دستورزبان نیاز به یک زبان شناس حرفه ای برای طراحی دقیق دستورزبانی که استفاده خواهد شد، دارند. برای ترجمه بین زبان های نزدیک بهم ،تکنیکی به نام ترجمه ماشینی مبتنی بر انتقال سطحی [۴] ممکن است استفاده شود.
روش قانونمند

الگوی ترجمه ماشینی قانون مند شامل الگوی ترجمه ماشینی مبتنی بر انتقال، ترجمه ماشینی بین زبانی و ترجمه ماشینی مبتنی بر فرهنگ لغت می باشد:
روش بین زبانی
ترجمه ماشینی بین زبانی نمونه ای از ترجمه ماشینی قانونمند می باشد. در این روش، متن به زبان مبدا به یک متن بین زبانی(بعنوان مثال، زبانهای بین المللی کمکی همانند اسپرانتو ) که مستقل از زبان مقصد است، تبدیل میشود. سپس متن به زبان مقصد از متن بین زبانی، تولید خواهد شد.
روش مبتنی بر فرهنگ لغت
ترجمه ماشینی می تواند از روشی مبتنی بر داده های فرهنگ لغت استفاده کند و این بدان معنی است که کلمات به همان گونه ای که در فرهنگ لغات موجودند،ترجمه می شوند.
روش آماری

ترجمه ماشینی به روش آماری، سعی در تولید ترجمه هایی دارد که از روشهای آماری مبتنی بر پیکره های متنی دوزبانی استفاده می کنند.همانند پیکره کانادایی هانسارد(Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا.
درحال حاضر این چنین پیکره هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی ، بدست می آید اما این چنین پیکره ای هنوز بسیار کمیاب است. اولین نرم‌افزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت آی‌بی‌امگوگل نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتا در اکتبر 2007 به مترجمی آماری تغییر روش داد. به تازگی ، گوگل قابلیت های ترجمه خود را بوسیله دادن 200 میلیون کلمه از اسناد سازمان ملل بعنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده اند. وبدین سان دقت ترجمه ها بهبود یافته است.[۵] بود.
روش مبتنی بر مثال

ترجمه ماشینی مبتنی بر مثال [۶] توسط ماکوتو ناگاوُ(Makoto Nagao)[۷] در سال 1984 مطرح شد.این روش اغلب با عنوان روش استفاده کننده از پیکره دوزبانی معرفی می شود. درواقع این روش ،ترجمه ای بر اساس تمثیل است و می توان آنرا به عنوان پیاده سازی روش استدلال موردی در یادگیری ماشینی تلقی کرد.