Sidor om ämnet:   [1 2] >
Работа с терминологическими базами кошек: как бороться с падежами
Trådens avsändare: Nikita Kobrin
Nikita Kobrin
Nikita Kobrin  Identity Verified
Litauen
Local time: 00:19
Medlem (2010)
Engelska till Ryska
+ ...
Jul 22, 2012

Разговор начался здесь: http://www.proz.com/forum/russian/229099-Фрилансинг_для_переводчика_пенсионера-page2.html#1986166

Чтобы не отклоняться там от темы, решил создать новую.

Sergei Tumanov wrote:

Nikita Kobrin wrote:

Sergei Tumanov wrote:

Если в Мультитерм при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах, то смена падежных окончаний вручную после вставки термина в текст будет нужна гораздо реже.

Надеюсь, это шутка такая? Тут следует улыбнуться?

Nikita Kobrin


Это не шутка.

Мне такой вариант работы с терминами нравится.


Ага, значит надежды мои рухнули - это не шутка. Ну, что же, Сергей, тогда давайте взглянем на ваше предложение подробнее.

Возьмем один из терминов одной из моих баз. Сейчас там все выглядит так:


English:

browser helper object

Russian:

вспомогательный объект браузера


Вы предлагаете "при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах". Если я правильно понимаю вашу идею, после предложенной операции словарная статья будет выглядеть следующим образом:


English:

browser helper object

Russian:

вспомогательный объект браузера
вспомогательного объекта браузера
вспомогательному объекту браузера
вспомогательным объектом браузера
вспомогательном объекте браузера


Таких словарных статей в базах обычно сотни, а иногда и тысячи. Сергей, вы отдаете себе отчет:

1) Сколько понадобится времени, для введения всех падежных форм КАЖДОГО термина? Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.

2) Как будут выглядеть ваши базы?

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?


На мой взгляд, сия метода совершенно неразумна. Поэтому и подумал сначала, что это была шутка.

Или я что-то упустил, чего-то не понимаю? Что думают по этому поводу коллеги?

Nikita Kobrin


 
Sergey Inaekyan
Sergey Inaekyan
Local time: 01:19
Engelska till Ryska
+ ...
Частотность употребления падежей Jul 22, 2012

Nikita Kobrin wrote:
Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.


1. Вручную термины никогда не ввожу. Достаточно вручную внести термин в текст перевода один раз, а затем воспользоваться горячими клавишами для ввода в базу Мультитерма всех видов, словарь Транзита и т. д.
2. Многолетний опыт ввода в базу терминов по п.1 показал, что в базе должен быть термин в именительном и родительном падеже. 2 падежа охватывают большинство случаев употребления термина (тексты технические, машиностроение).
Оказывается в Интернете имеется научное обоснование моей голой эмпирике
"Среди падежных форм первое место по частотности употребления занимают формы родительного падежа".
П.1 является обязательным для всех, кто зарабатывает фрилансом, а п. 2 - по желанию переводчика.


 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 00:19
Engelska till Ryska
+ ...
Не так страшен черт, как его малюют. Jul 22, 2012

Тысячи терминов -- это, конечно, серьезно.

Однако, если учесть, что (я про свой опыт) терминами база наполняется только для перевода конкретных проектов, и ВО ВРЕМЯ перевода оных, то имяимлегион слегка усекается до двадцати-тридцати терминов на проект. А это уже смотрится слегка по-другому. Ну не так ужасно
:0)


 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 00:19
Engelska till Ryska
+ ...
ответы на конкретные вопросы Jul 22, 2012

пункт 2

А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++

пункт 3

Не знаю, если честно

Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в
... See more
пункт 2

А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++

пункт 3

Не знаю, если честно

Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в окне традоса. Я эту часть окна традоса за рамку монитора вывожу, чтобы место было для редактора текстового больше, поэтому меня она не пугает.

Я тупо жму клавишу "стрелка вправо", и в сегменте перевода выскакивают варианты термина в нужных падежах. Когда появляется нужный -- я просто перестаю прессовать означенную стрелку. Если проскочил, то разок жму стрелку влево.

[Edited at 2012-07-22 20:02 GMT]
Collapse


 
Gennady Lapardin
Gennady Lapardin  Identity Verified
Ryska federationen
Local time: 01:19
Italienska till Ryska
+ ...
Спелчекер, не встроенный, а отдельное приложение Jul 22, 2012

В английском давно решенная проблема. Допустим, перевожу (накрывшись толстым одеялом, чтобы никто не увидел) с русского на английский. Одновременно активны Традос и спелчекер. Открываю сегмент, пишу перевод, нажимаю клавишу F, спелчекер моментально проверяет сегмент, выдает свое заключение, правлю, закрываю сегмент.
Может быть, когда-то и над русским языком взойдет заря?

[Edited at 2012-07-22 20:49 GMT]


 
Nadiia and Vatslav Yehurnovy
Nadiia and Vatslav Yehurnovy
Ukraina
Local time: 00:19
Medlem (2008)
Engelska till Ryska
+ ...
Оно и так выглядит неплохо :) Jul 23, 2012

Nikita Kobrin wrote:

3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?

В MemoQ 5 система еще помимо поиска по ТМ (красненькое) и базе терминов (синенькое) предлагает "авотсобранное" из кусков предложение (фиолетовое) и потом ниже в списке еще кусочки (желтенькое) - то что считается кандидатами в термины или просто есть в ТМ, но покороче. Часто это удобно настолько, что можно и конкретно лениться с базой терминов. Длинные однотипные юридические предложения, в результате, становятся во много раз более победимыми.

А еще можно Евробанк терминов подключить, вот тогда скроллить-неперескроллить по длиннющему списку предлагаемых вариантов

Волевым решением сейчас "красненького" в настройках оставлено не более 5 строчек и банк терминов включается только в крайних случаях.

Самое большое удовольствие - по нажатию Ctrl+цифра вставить по месту кусок из слов 10 (никакой не термин, все из ТМ) с минимальной необходимостью его править. Или ткнуть в него мышью, если нужный кусочек "выплыл" за 20 доступных с клавиатуры вариантов.

По части спелчекера - для русского языка "Орфо" никто не отменял, да и стоит она как не столь уж много учетных страниц. И не верьте, что она вся целиком и полностью встроена в MS Office

Жаль, что для украинского языка похожая штуковина крепко отстает в развитии, в том числе и с русским.


 
Yuri Dubrov
Yuri Dubrov  Identity Verified
Ryska federationen
Local time: 01:19
Engelska till Ryska
+ ...
кстати вышла ОРФО 2012 Jul 23, 2012

ОРФО 2012 12.0.1 Профессиональная
скачать пробную версию
http://www.informatic.ru/node/95

Что удивило> предлагает изменить е на ё и наоборот


 
Andrej
Andrej  Identity Verified
Local time: 03:19
Medlem (2005)
Tyska till Ryska
+ ...
--- Jul 23, 2012

Yuri Dubrov wrote:

Что удивило> предлагает изменить е на ё и наоборот


В Офисе 2010 тоже предлагается оба варианта. Думаю, они просто не стали связываться с ёфикаторами и плодить бесконечные споры, а просто предложили каждому делать выбор самостоятельно в зависимости от личного уровня и предпочтений, ну, и желания нарушать правила. Кстати, вот отличнейшая статья: http://gramota.ru/class/istiny/istiny_7_jo/


 
Vitali Stanisheuski
Vitali Stanisheuski
Vitryssland
Local time: 01:19
Medlem (2005)
Engelska till Ryska
+ ...
SITE LOCALIZER
у одного моего клиента Jul 23, 2012

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке соблюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.

 
Alexey Ivanov
Alexey Ivanov  Identity Verified
Ryska federationen
Local time: 01:19
Engelska till Ryska
Мне не кажется это удобным Jul 23, 2012

Vitali Stanisheuski wrote:

У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке с облюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.


Я для себя сделал вывод, что удобнее иметь в базе Multiterm слова в обоих наиболее часто встречающихся падежах - именительном и родительном. Я не завожу специально в базу Multiterm термин/терминологическое словосочетание сразу в двух падежах. Сначала заношу слово в том падеже, в котором оно встретилось в первый раз, а затем, если оно встречается в другом падеже, завожу его и в этом падеже. Если использовать одновременно с Multiterm функцию Autosuggest, то подсказка включает оба варианта и можно выбирать из ниспадающего списка, слово в том падеже, который подходит для данного случая, просто спустившись или поднявшись по списку. В остальных случаях гораздо быстрее просто набирать на клавиатуре нужное слово/словосочетание, чем править окончания одного, а тем более 2-3 слов. Но даже и без Autosuggest в программе распознавания терминов будут представлены оба (или более вариантов) и можно просто выбрать нужный и щелкнуть иконку "Вставить" в окне распознавания терминов в Studio.
Если же, как предлагает ваш клиент, иметь в базе Multiterm только основу словоформы, то придется либо входить в текст и вносить падежные окончания, либо вводить слово/словосочетание с клавиатуры. Конечно, с учетом проверки последовательности перевода терминов в программах типа XBench это дает выигрыш во времени, но, с другой стороны, все строки, где явно, что ошибки перевода, зарегистрированные программой проверки качества перевода, связаны с различием падежных окончаний можно просто игнорировать. Я именно так и делаю.

[Edited at 2012-07-23 14:33 GMT]


 
Natalia Kobzareva
Natalia Kobzareva  Identity Verified
Israel
Local time: 00:19
Engelska till Ryska
+ ...
Призрак бродит по Европе... Jul 23, 2012

Только сегодня взмечтанулось о сохранении падежей в Мультитерме.
В следующий раз на каком-нибудь большом проекте попробую идею с именительным и родительным падежом.


 
Gennady Lapardin
Gennady Lapardin  Identity Verified
Ryska federationen
Local time: 01:19
Italienska till Ryska
+ ...
Орфо-демо Jul 23, 2012

Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........

Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more preci
... See more
Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........

Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more precise understanding of the mechanical properties of the periodontal ligament in continuously erupting incisors [by] comparing the shear stress-strain relations." в случае первой скобочки (пропуска) просигналил и порекомендовал "was obtained/obtains". Вторую скобочку разрешил оставить, то есть "by" там не особенно и нужно.
Collapse


 
Sergei Tumanov
Sergei Tumanov  Identity Verified
Local time: 00:19
Engelska till Ryska
+ ...
еще множественное число Jul 23, 2012

заношу.
В обоих падежах
И даже иногда прямо с предлогом, если видно, что в тексте термин встретится не меньше трех-четырех раз.


 
bogdan_demeshko
bogdan_demeshko
Local time: 05:19
Kinesiska till Ryska
+ ...
что предлагают CATы? May 17, 2014

в MemoQ при вводе термина в терминологическую базу возможен такой формат его ввода: "терминологическ|ая баз|а", если увеличить "чувствительность" поиска по терминологической базе (я использую только 100%-ы совпадения), то, например, при такой форме ввода термина MemoQ найдет термин; если в тексте попадется вариант в другом падеже, то не найдет, если тот же термин вписать без отделения окончания знаком "|". если ли что-нибудь подобное в MultiTerm 2011 или 2014?..

 
Valery Afanasiev
Valery Afanasiev  Identity Verified
Ryska federationen
Local time: 01:19
Engelska till Ryska
+ ...
А зачем вообще работать с терминологическими базами? May 17, 2014

Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько... See more
Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько лет я в принципе не пользуюсь извлечением терминологии и/или вставкой отдельных терминов из какой-либо базы/словаря/и т.п.

Я и в самом деле не понимаю, как терминологическая база ускоряет и повышает качество перевода в целом. Даже при условии, что в ней нет ошибок.

В свое время я даже пытался загнать в ТМ "весь Мультитран" и у меня почти получилось. Но, погоняв свои проекты, я понял, что толку от этих упражнений - чуть.

Может, я чего-то не понимаю? Но обычно мне нужен не просто термин, а термин в окружении какого-никакого контекста и тех или иных грамматических и синтаксических конструкций. Так стоит ли вообще связываться с тёрм-базами?
Collapse


 
Sidor om ämnet:   [1 2] >


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Работа с терминологическими базами кошек: как бороться с падежами


Translation news in Ryska federationen





Anycount & Translation Office 3000
Translation Office 3000

Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.

More info »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »