Работа с терминологическими базами кошек: как бороться с падежами (Russian)

Icke-engelska forum » Russian »
Работа с терминологическими базами кошек: как бороться с падежами
Track this topic

Sidor om ämnet: [1 2] >

Работа с терминологическими базами кошек: как бороться с падежами

Trådens avsändare: Nikita Kobrin

Nikita Kobrin

Litauen
Local time: 00:19
Medlem (2010)
Engelska till Ryska
+ ...

Jul 22, 2012

Разговор начался здесь: http://www.proz.com/forum/russian/229099-Фрилансинг_для_переводчика_пенсионера-page2.html#1986166

Чтобы не отклоняться там от темы, решил создать новую.

Sergei Tumanov wrote:

Nikita Kobrin wrote:

Sergei Tumanov wrote:

Если в Мультитерм при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах, то смена падежных окончаний вручную после вставки термина в текст будет нужна гораздо реже.

Надеюсь, это шутка такая? Тут следует улыбнуться?

Nikita Kobrin

Это не шутка.

Мне такой вариант работы с терминами нравится.

Ага, значит надежды мои рухнули - это не шутка. Ну, что же, Сергей, тогда давайте взглянем на ваше предложение подробнее.

Возьмем один из терминов одной из моих баз. Сейчас там все выглядит так:

English:

browser helper object

Russian:

вспомогательный объект браузера

Вы предлагаете "при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах". Если я правильно понимаю вашу идею, после предложенной операции словарная статья будет выглядеть следующим образом:

English:

browser helper object

Russian:

вспомогательный объект браузера
вспомогательного объекта браузера
вспомогательному объекту браузера
вспомогательным объектом браузера
вспомогательном объекте браузера

Таких словарных статей в базах обычно сотни, а иногда и тысячи. Сергей, вы отдаете себе отчет:

1) Сколько понадобится времени, для введения всех падежных форм КАЖДОГО термина? Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.

2) Как будут выглядеть ваши базы?

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?

На мой взгляд, сия метода совершенно неразумна. Поэтому и подумал сначала, что это была шутка.

Или я что-то упустил, чего-то не понимаю? Что думают по этому поводу коллеги?

Nikita Kobrin

Sergey Inaekyan
Local time: 01:19
Engelska till Ryska
+ ...

Частотность употребления падежей

Jul 22, 2012

Nikita Kobrin wrote:
Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.

1. Вручную термины никогда не ввожу. Достаточно вручную внести термин в текст перевода один раз, а затем воспользоваться горячими клавишами для ввода в базу Мультитерма всех видов, словарь Транзита и т. д.
2. Многолетний опыт ввода в базу терминов по п.1 показал, что в базе должен быть термин в именительном и родительном падеже. 2 падежа охватывают большинство случаев употребления термина (тексты технические, машиностроение).
Оказывается в Интернете имеется научное обоснование моей голой эмпирике
"Среди падежных форм первое место по частотности употребления занимают формы родительного падежа".
П.1 является обязательным для всех, кто зарабатывает фрилансом, а п. 2 - по желанию переводчика.

Sergei Tumanov

Local time: 00:19
Engelska till Ryska
+ ...

Не так страшен черт, как его малюют.

Jul 22, 2012

Тысячи терминов -- это, конечно, серьезно.

Однако, если учесть, что (я про свой опыт) терминами база наполняется только для перевода конкретных проектов, и ВО ВРЕМЯ перевода оных, то имяимлегион слегка усекается до двадцати-тридцати терминов на проект. А это уже смотрится слегка по-другому. Ну не так ужасно
:0)

Sergei Tumanov

Local time: 00:19
Engelska till Ryska
+ ...

ответы на конкретные вопросы

Jul 22, 2012

пункт 2

А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++

пункт 3

Не знаю, если честно

Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в окне традоса. Я эту часть окна традоса за рамку монитора вывожу, чтобы место было для редактора текстового больше, поэтому меня она не пугает.

Я тупо жму клавишу "стрелка вправо", и в сегменте перевода выскакивают варианты термина в нужных падежах. Когда появляется нужный -- я просто перестаю прессовать означенную стрелку. Если проскочил, то разок жму стрелку влево.

[Edited at 2012-07-22 20:02 GMT] ▲ Collapse

Gennady Lapardin

Ryska federationen
Local time: 01:19
Italienska till Ryska
+ ...

Спелчекер, не встроенный, а отдельное приложение

Jul 22, 2012

В английском давно решенная проблема. Допустим, перевожу (накрывшись толстым одеялом, чтобы никто не увидел) с русского на английский. Одновременно активны Традос и спелчекер. Открываю сегмент, пишу перевод, нажимаю клавишу F, спелчекер моментально проверяет сегмент, выдает свое заключение, правлю, закрываю сегмент.
Может быть, когда-то и над русским языком взойдет заря?

[Edited at 2012-07-22 20:49 GMT]

Nadiia and Vatslav Yehurnovy
Ukraina
Local time: 00:19
Medlem (2008)
Engelska till Ryska
+ ...

Оно и так выглядит неплохо :)

Jul 23, 2012

Nikita Kobrin wrote:

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?

В MemoQ 5 система еще помимо поиска по ТМ (красненькое) и базе терминов (синенькое) предлагает "авотсобранное" из кусков предложение (фиолетовое) и потом ниже в списке еще кусочки (желтенькое) - то что считается кандидатами в термины или просто есть в ТМ, но покороче. Часто это удобно настолько, что можно и конкретно лениться с базой терминов. Длинные однотипные юридические предложения, в результате, становятся во много раз более победимыми.

А еще можно Евробанк терминов подключить, вот тогда скроллить-неперескроллить по длиннющему списку предлагаемых вариантов

Волевым решением сейчас "красненького" в настройках оставлено не более 5 строчек и банк терминов включается только в крайних случаях.

Самое большое удовольствие - по нажатию Ctrl+цифра вставить по месту кусок из слов 10 (никакой не термин, все из ТМ) с минимальной необходимостью его править. Или ткнуть в него мышью, если нужный кусочек "выплыл" за 20 доступных с клавиатуры вариантов.

По части спелчекера - для русского языка "Орфо" никто не отменял, да и стоит она как не столь уж много учетных страниц. И не верьте, что она вся целиком и полностью встроена в MS Office

Жаль, что для украинского языка похожая штуковина крепко отстает в развитии, в том числе и с русским.

Yuri Dubrov

Ryska federationen
Local time: 01:19
Engelska till Ryska
+ ...

кстати вышла ОРФО 2012

Jul 23, 2012

ОРФО 2012 12.0.1 Профессиональная
скачать пробную версию
http://www.informatic.ru/node/95

Что удивило> предлагает изменить е на ё и наоборот

Andrej

Local time: 03:19
Medlem (2005)
Tyska till Ryska
+ ...

---

Jul 23, 2012

Yuri Dubrov wrote:

Что удивило> предлагает изменить е на ё и наоборот

В Офисе 2010 тоже предлагается оба варианта. Думаю, они просто не стали связываться с ёфикаторами и плодить бесконечные споры, а просто предложили каждому делать выбор самостоятельно в зависимости от личного уровня и предпочтений, ну, и желания нарушать правила. Кстати, вот отличнейшая статья: http://gramota.ru/class/istiny/istiny_7_jo/

Vitali Stanisheuski
Vitryssland
Local time: 01:19
Medlem (2005)
Engelska till Ryska
+ ...

SITE LOCALIZER

у одного моего клиента

Jul 23, 2012

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке соблюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.

Alexey Ivanov

Ryska federationen
Local time: 01:19
Engelska till Ryska

Мне не кажется это удобным

Jul 23, 2012

Vitali Stanisheuski wrote:

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке с облюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.

Я для себя сделал вывод, что удобнее иметь в базе Multiterm слова в обоих наиболее часто встречающихся падежах - именительном и родительном. Я не завожу специально в базу Multiterm термин/терминологическое словосочетание сразу в двух падежах. Сначала заношу слово в том падеже, в котором оно встретилось в первый раз, а затем, если оно встречается в другом падеже, завожу его и в этом падеже. Если использовать одновременно с Multiterm функцию Autosuggest, то подсказка включает оба варианта и можно выбирать из ниспадающего списка, слово в том падеже, который подходит для данного случая, просто спустившись или поднявшись по списку. В остальных случаях гораздо быстрее просто набирать на клавиатуре нужное слово/словосочетание, чем править окончания одного, а тем более 2-3 слов. Но даже и без Autosuggest в программе распознавания терминов будут представлены оба (или более вариантов) и можно просто выбрать нужный и щелкнуть иконку "Вставить" в окне распознавания терминов в Studio.
Если же, как предлагает ваш клиент, иметь в базе Multiterm только основу словоформы, то придется либо входить в текст и вносить падежные окончания, либо вводить слово/словосочетание с клавиатуры. Конечно, с учетом проверки последовательности перевода терминов в программах типа XBench это дает выигрыш во времени, но, с другой стороны, все строки, где явно, что ошибки перевода, зарегистрированные программой проверки качества перевода, связаны с различием падежных окончаний можно просто игнорировать. Я именно так и делаю.

[Edited at 2012-07-23 14:33 GMT]

Natalia Kobzareva

Israel
Local time: 00:19
Engelska till Ryska
+ ...

Призрак бродит по Европе...

Jul 23, 2012

Только сегодня взмечтанулось о сохранении падежей в Мультитерме.
В следующий раз на каком-нибудь большом проекте попробую идею с именительным и родительным падежом.

Gennady Lapardin

Ryska federationen
Local time: 01:19
Italienska till Ryska
+ ...

Орфо-демо

Jul 23, 2012

Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........

Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more precise understanding of the mechanical properties of the periodontal ligament in continuously erupting incisors [by] comparing the shear stress-strain relations." в случае первой скобочки (пропуска) просигналил и порекомендовал "was obtained/obtains". Вторую скобочку разрешил оставить, то есть "by" там не особенно и нужно. ▲ Collapse

Sergei Tumanov

Local time: 00:19
Engelska till Ryska
+ ...

еще множественное число

Jul 23, 2012

заношу.
В обоих падежах
И даже иногда прямо с предлогом, если видно, что в тексте термин встретится не меньше трех-четырех раз.

bogdan_demeshko
Local time: 05:19
Kinesiska till Ryska
+ ...

что предлагают CATы?

May 17, 2014

в MemoQ при вводе термина в терминологическую базу возможен такой формат его ввода: "терминологическ|ая баз|а", если увеличить "чувствительность" поиска по терминологической базе (я использую только 100%-ы совпадения), то, например, при такой форме ввода термина MemoQ найдет термин; если в тексте попадется вариант в другом падеже, то не найдет, если тот же термин вписать без отделения окончания знаком "|". если ли что-нибудь подобное в MultiTerm 2011 или 2014?..

Valery Afanasiev

Ryska federationen
Local time: 01:19
Engelska till Ryska
+ ...

А зачем вообще работать с терминологическими базами?

May 17, 2014

Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько лет я в принципе не пользуюсь извлечением терминологии и/или вставкой отдельных терминов из какой-либо базы/словаря/и т.п.

Я и в самом деле не понимаю, как терминологическая база ускоряет и повышает качество перевода в целом. Даже при условии, что в ней нет ошибок.

В свое время я даже пытался загнать в ТМ "весь Мультитран" и у меня почти получилось. Но, погоняв свои проекты, я понял, что толку от этих упражнений - чуть.

Может, я чего-то не понимаю? Но обычно мне нужен не просто термин, а термин в окружении какого-никакого контекста и тех или иных грамматических и синтаксических конструкций. Так стоит ли вообще связываться с тёрм-базами? ▲ Collapse

Sidor om ämnet: [1 2] >

Login to reply/comment

To report site rules violations or get help, contact a site moderator:

Moderatorer för detta forum
Natalie	[Call to this topic]
Jarema	[Call to this topic]
Margarita	[Call to this topic]
Andriy Bublikov	[Call to this topic]

You can also contact site staff by submitting a support request »

Работа с терминологическими базами кошек: как бороться с падежами

Translation news in Ryska federationen

No recent translation news about Ryska federationen.

Submit a news story about translation in Ryska federationen »
Read more translation news »

Forum rules

Help and orientation

Anycount & Translation Office 3000
Translation Office 3000 Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators. More info »

Wordfast Pro
Translation Memory Software for Any Platform Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value Buy now! »

Senaste inläggen | VANLIGA FRÅGOR | Regler | Moderatorer | Artikelkunskapsbas

Your current localization setting

Svenska

Select a language

More languages...

Работа с терминологическими базами кошек: как бороться с падежами

Работа с терминологическими базами кошек: как бороться с падежами

You have native languages that can be verified

Your current localization setting

Select a language