1:the two resulting partitions of the instance set are then optimally matched, before the remaining instances, corresponding to cases of disagreement between both modalities, are finally processed.
2:Most of state-of-the-art systems rely on a two-step approach, performing first speaker turn detection followed by single-speaker segment clustering.
分詞構文の部分【, performing~clustering】は【Most of state-of-the-art systems】にかかっているとみて良いのでしょうか?
3:More recently, SD was extended to video streams, facing the critical issue of processing contents produced in uncontrolled and variable environments.
この文章の分詞構文の部分【, facing ~】は【and face ~】として訳してしまって良いのでしょうか?
4:On the other hand, movie dialogue scenes exhibit formal regularities at a visual level, with two alternating and recurring shots, each one corresponding to one of the two speakers involved.
【, with two~】はその前の文章(movie ~ visual level)のどの部分と関連しているのでしょうか?
5:We manually annotated three episodes of each series by indicating shot cuts, similar shots, speech segments as well as the corresponding speakers.
【as well as ~】はその直前のspeech segmentsのみにかかるのでしょうか?
それとも、shot cuts と similar shots と speech segmentsのすべてにかかるのでしょうか?
こんばんは! 早速のご教示をどうもありがとうございました。 ビデオ観てみましたが、ヒラリー本人でないので驚きましたが どなたかがその素晴らしいスピーチを再現されたというものですよね。 和訳を読みたかったのですが、英語のサブタイトルしか見当たりませんでした。 もし和訳もご存知でしたら、アドバイスをください。 どうもありがとうございました。