回答:
IIT Bombayの研究者による次の調査記事は、皮肉検出の最近の進歩をまとめたものです:Arxiv link。
あなたの質問に関連して、私はそれが非常に難しいとか、無制限とは考えていません。コンピューターはまだ処理できない曖昧さをもたらしますが、人間は皮肉を簡単に理解できるため、皮肉検出のためにデータセットにラベルを付けることができます。
ニューラルネットワーク(正確にはCNN)が同じ目的で使用される同じドメインで最近の研究がありました。いくつかの情報。研究について:
このコンテキストを学習するために、この論文では、ニューラルネットワークがユーザーの「埋め込み」、つまり、以前のツイートのコンテンツ、関連する興味やアカウントなどのコンテキストキューを見つける方法について説明します。これらのさまざまな要因を使用してユーザーを他のユーザーとプロットし、(理想的には)比較的明確に定義されたグループを形成していることを見つけます。
そのため、このペーパーでは、テキスト内の皮肉を検出するために、CNN、単語、およびユーザーの埋め込みを使用しています。それに関するTechcrunchの記事もあります。
この論文は、ツイートの感情を使用して、他の同様のツイートの感情と比較します。
ツイートの感情が、同様のユーザーによって表明された内容の大部分と一致しないように思われる場合、皮肉が採用されている可能性が十分にあります。