Sidor om ämnet: [1 2] > | Работа с терминологическими базами кошек: как бороться с падежами Trådens avsändare: Nikita Kobrin
| Nikita Kobrin Litauen Local time: 00:19 Medlem (2010) Engelska till Ryska + ...
Разговор начался здесь: http://www.proz.com/forum/russian/229099-Фрилансинг_для_переводчика_пенсионера-page2.html#1986166
Чтобы не отклоняться там от темы, решил создать новую.
Sergei Tumanov wrote:
Nikita Kobrin wrote:
Sergei Tumanov wrote:
Если в Мультитерм при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах, то смена падежных окончаний вручную после вставки термина в текст будет нужна гораздо реже.
Надеюсь, это шутка такая? Тут следует улыбнуться?
Это не шутка.
Мне такой вариант работы с терминами нравится.
Ага, значит надежды мои рухнули - это не шутка. Ну, что же, Сергей, тогда давайте взглянем на ваше предложение подробнее.
Возьмем один из терминов одной из моих баз. Сейчас там все выглядит так:
English:
browser helper object
Russian:
вспомогательный объект браузера
Вы предлагаете "при создании словарной статьи вставить несколько вариантов написания русского термина в разных падежах". Если я правильно понимаю вашу идею, после предложенной операции словарная статья будет выглядеть следующим образом:
English:
browser helper object
Russian:
вспомогательный объект браузера
вспомогательного объекта браузера
вспомогательному объекту браузера
вспомогательным объектом браузера
вспомогательном объекте браузера
Таких словарных статей в базах обычно сотни, а иногда и тысячи. Сергей, вы отдаете себе отчет:
1) Сколько понадобится времени, для введения всех падежных форм КАЖДОГО термина? Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.
2) Как будут выглядеть ваши базы?
3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?
На мой взгляд, сия метода совершенно неразумна. Поэтому и подумал сначала, что это была шутка.
Или я что-то упустил, чего-то не понимаю? Что думают по этому поводу коллеги?
| | | Частотность употребления падежей | Jul 22, 2012 |
Nikita Kobrin wrote:
Ведь это все тоже нужно вводить вручную. При этом вы никогда не можете предвидеть наверняка, какие подежные формы вам понадобятся, а какие нет.
1. Вручную термины никогда не ввожу. Достаточно вручную внести термин в текст перевода один раз, а затем воспользоваться горячими клавишами для ввода в базу Мультитерма всех видов, словарь Транзита и т. д.
2. Многолетний опыт ввода в базу терминов по п.1 показал, что в базе должен быть термин в именительном и родительном падеже. 2 падежа охватывают большинство случаев употребления термина (тексты технические, машиностроение).
Оказывается в Интернете имеется научное обоснование моей голой эмпирике
"Среди падежных форм первое место по частотности употребления занимают формы родительного падежа".
П.1 является обязательным для всех, кто зарабатывает фрилансом, а п. 2 - по желанию переводчика. | | | Не так страшен черт, как его малюют. | Jul 22, 2012 |
Тысячи терминов -- это, конечно, серьезно.
Однако, если учесть, что (я про свой опыт) терминами база наполняется только для перевода конкретных проектов, и ВО ВРЕМЯ перевода оных, то имяимлегион слегка усекается до двадцати-тридцати терминов на проект. А это уже смотрится слегка по-другому. Ну не так ужасно
:0) | | | ответы на конкретные вопросы | Jul 22, 2012 |
пункт 2
А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++
пункт 3
Не знаю, если честно
Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в ... See more пункт 2
А какое кому дело?
Мне будет полезно, а на остальное мне чихать
++++++++++
пункт 3
Не знаю, если честно
Я мемоку не пользуюсь. Потому и не переживаю.
Говорил про Мультитерм. Там только один термин и кучу его переводов за один раз кажет в окне традоса. Я эту часть окна традоса за рамку монитора вывожу, чтобы место было для редактора текстового больше, поэтому меня она не пугает.
Я тупо жму клавишу "стрелка вправо", и в сегменте перевода выскакивают варианты термина в нужных падежах. Когда появляется нужный -- я просто перестаю прессовать означенную стрелку. Если проскочил, то разок жму стрелку влево.
[Edited at 2012-07-22 20:02 GMT] ▲ Collapse | |
|
|
Gennady Lapardin Ryska federationen Local time: 01:19 Italienska till Ryska + ... Спелчекер, не встроенный, а отдельное приложение | Jul 22, 2012 |
В английском давно решенная проблема. Допустим, перевожу (накрывшись толстым одеялом, чтобы никто не увидел) с русского на английский. Одновременно активны Традос и спелчекер. Открываю сегмент, пишу перевод, нажимаю клавишу F, спелчекер моментально проверяет сегмент, выдает свое заключение, правлю, закрываю сегмент.
Может быть, когда-то и над русским языком взойдет заря?
[Edited at 2012-07-22 20:49 GMT] | | | Оно и так выглядит неплохо :) | Jul 23, 2012 |
Nikita Kobrin wrote:
3) Как будет выглядеть та область интерфейса вашей кошки, в которой отображаются результаты поиска по TM и терминологической базе (в MemoQ она называется Translation Results)? Ведь там будет по 5 вариантов каждого термина. А если в одном сегменте вам встретиться перечисление 5 терминов? 5 х 5 = 25! Вы серьезно считате, что этим будет удобно пользоваться?
В MemoQ 5 система еще помимо поиска по ТМ (красненькое) и базе терминов (синенькое) предлагает "авотсобранное" из кусков предложение (фиолетовое) и потом ниже в списке еще кусочки (желтенькое) - то что считается кандидатами в термины или просто есть в ТМ, но покороче. Часто это удобно настолько, что можно и конкретно лениться с базой терминов. Длинные однотипные юридические предложения, в результате, становятся во много раз более победимыми.
А еще можно Евробанк терминов подключить, вот тогда скроллить-неперескроллить по длиннющему списку предлагаемых вариантов
Волевым решением сейчас "красненького" в настройках оставлено не более 5 строчек и банк терминов включается только в крайних случаях.
Самое большое удовольствие - по нажатию Ctrl+цифра вставить по месту кусок из слов 10 (никакой не термин, все из ТМ) с минимальной необходимостью его править. Или ткнуть в него мышью, если нужный кусочек "выплыл" за 20 доступных с клавиатуры вариантов.
По части спелчекера - для русского языка "Орфо" никто не отменял, да и стоит она как не столь уж много учетных страниц. И не верьте, что она вся целиком и полностью встроена в MS Office
Жаль, что для украинского языка похожая штуковина крепко отстает в развитии, в том числе и с русским. | | | Yuri Dubrov Ryska federationen Local time: 01:19 Engelska till Ryska + ... кстати вышла ОРФО 2012 | Jul 23, 2012 |
ОРФО 2012 12.0.1 Профессиональная
скачать пробную версию
http://www.informatic.ru/node/95
Что удивило> предлагает изменить е на ё и наоборот | | | Andrej Local time: 03:19 Medlem (2005) Tyska till Ryska + ...
Yuri Dubrov wrote:
Что удивило> предлагает изменить е на ё и наоборот
В Офисе 2010 тоже предлагается оба варианта. Думаю, они просто не стали связываться с ёфикаторами и плодить бесконечные споры, а просто предложили каждому делать выбор самостоятельно в зависимости от личного уровня и предпочтений, ну, и желания нарушать правила. Кстати, вот отличнейшая статья: http://gramota.ru/class/istiny/istiny_7_jo/ | |
|
|
Vitali Stanisheuski Vitryssland Local time: 01:19 Medlem (2005) Engelska till Ryska + ... SITE LOCALIZER у одного моего клиента | Jul 23, 2012 |
У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке соблюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм. | | | Alexey Ivanov Ryska federationen Local time: 01:19 Engelska till Ryska Мне не кажется это удобным | Jul 23, 2012 |
Vitali Stanisheuski wrote:
У одного моего клиента в базе Multiterm русские слова были без окончаний. Как понимаю, это решает две задачи - 1) переводчику надо не править каноническую форму, а просто дописать нужное окончание 2) при проверке с облюдения терминологии автоматическими средствами (напр. XBench) эти средства не сигнализируют напрасно просто из-за несовпадения падежных форм.
Я для себя сделал вывод, что удобнее иметь в базе Multiterm слова в обоих наиболее часто встречающихся падежах - именительном и родительном. Я не завожу специально в базу Multiterm термин/терминологическое словосочетание сразу в двух падежах. Сначала заношу слово в том падеже, в котором оно встретилось в первый раз, а затем, если оно встречается в другом падеже, завожу его и в этом падеже. Если использовать одновременно с Multiterm функцию Autosuggest, то подсказка включает оба варианта и можно выбирать из ниспадающего списка, слово в том падеже, который подходит для данного случая, просто спустившись или поднявшись по списку. В остальных случаях гораздо быстрее просто набирать на клавиатуре нужное слово/словосочетание, чем править окончания одного, а тем более 2-3 слов. Но даже и без Autosuggest в программе распознавания терминов будут представлены оба (или более вариантов) и можно просто выбрать нужный и щелкнуть иконку "Вставить" в окне распознавания терминов в Studio.
Если же, как предлагает ваш клиент, иметь в базе Multiterm только основу словоформы, то придется либо входить в текст и вносить падежные окончания, либо вводить слово/словосочетание с клавиатуры. Конечно, с учетом проверки последовательности перевода терминов в программах типа XBench это дает выигрыш во времени, но, с другой стороны, все строки, где явно, что ошибки перевода, зарегистрированные программой проверки качества перевода, связаны с различием падежных окончаний можно просто игнорировать. Я именно так и делаю.
[Edited at 2012-07-23 14:33 GMT] | | | Призрак бродит по Европе... | Jul 23, 2012 |
Только сегодня взмечтанулось о сохранении падежей в Мультитерме.
В следующий раз на каком-нибудь большом проекте попробую идею с именительным и родительным падежом. | | | Gennady Lapardin Ryska federationen Local time: 01:19 Italienska till Ryska + ...
Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........
Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more preci... See more Непобедимая армада ОРФО2012 проверила текст: "Авторы рецензии на работу указывали на отсутствие данных о биомеханические свойства тканей зубочелюстная система." Всё ок, можно отдавать заказчику........
Англоязычный спелчекер, проверив фразу "The aim of this study was [to] obtain more precise understanding of the mechanical properties of the periodontal ligament in continuously erupting incisors [by] comparing the shear stress-strain relations." в случае первой скобочки (пропуска) просигналил и порекомендовал "was obtained/obtains". Вторую скобочку разрешил оставить, то есть "by" там не особенно и нужно. ▲ Collapse | |
|
|
еще множественное число | Jul 23, 2012 |
заношу.
В обоих падежах
И даже иногда прямо с предлогом, если видно, что в тексте термин встретится не меньше трех-четырех раз. | | | что предлагают CATы? | May 17, 2014 |
в MemoQ при вводе термина в терминологическую базу возможен такой формат его ввода: "терминологическ|ая баз|а", если увеличить "чувствительность" поиска по терминологической базе (я использую только 100%-ы совпадения), то, например, при такой форме ввода термина MemoQ найдет термин; если в тексте попадется вариант в другом падеже, то не найдет, если тот же термин вписать без отделения окончания знаком "|". если ли что-нибудь подобное в MultiTerm 2011 или 2014?.. | | | А зачем вообще работать с терминологическими базами? | May 17, 2014 |
Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько... See more Я в свое время, когда только начинал пробовать CAT-программы, пробовал играться с функцией Lexicon в Deja Vu X и с Multiterm Extract. И, поигравшись, понял, что пользование базами терминов не добавляет ни скорости, ни качества. Гораздо оптимальнее работать с сегментами ТМ. И вот уже несколько лет я в принципе не пользуюсь извлечением терминологии и/или вставкой отдельных терминов из какой-либо базы/словаря/и т.п.
Я и в самом деле не понимаю, как терминологическая база ускоряет и повышает качество перевода в целом. Даже при условии, что в ней нет ошибок.
В свое время я даже пытался загнать в ТМ "весь Мультитран" и у меня почти получилось. Но, погоняв свои проекты, я понял, что толку от этих упражнений - чуть.
Может, я чего-то не понимаю? Но обычно мне нужен не просто термин, а термин в окружении какого-никакого контекста и тех или иных грамматических и синтаксических конструкций. Так стоит ли вообще связываться с тёрм-базами? ▲ Collapse | | | Sidor om ämnet: [1 2] > | To report site rules violations or get help, contact a site moderator: You can also contact site staff by submitting a support request » Работа с терминологическими базами кошек: как бороться с падежами No recent translation news about Ryska federationen. |
Anycount & Translation Office 3000 | Translation Office 3000
Translation Office 3000 is an advanced accounting tool for freelance translators and small agencies. TO3000 easily and seamlessly integrates with the business life of professional freelance translators.
More info » |
| Wordfast Pro | Translation Memory Software for Any Platform
Exclusive discount for ProZ.com users!
Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value
Buy now! » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |