Article Brapci-Revistas

Metodologia para recomendação de vídeos baseada em descritores de conteúdo visuais e textuais

Methodology for video recommendation based on descriptors visual content and textual

Este trabalho aborda o desenvolvimento de uma nova abordagem multimodal para lidar com o problema de cold-start em sistemas de recomendação de vídeos. Dado um documento de vídeo, que geralmente consiste de uma sequência de imagens, áudio e informações relacionadas – como o título, tags (rótulos) e descrição –, a recomendação de vídeos visa encontrar uma lista dos vídeos mais relevantes para direcionar os usuários. O problema de cold-start é ocasionado quando, ao recomendar um item, não se possui informações sobre o usuário (cold-start user) ou sobre o item (cold-start item). Mais especificamente, nossa abordagem considera duas modalidades de informação: (i) visual (informações de cor e facial) e (ii) textual (tags, título e descrição) de informação. Para avaliar a recomendação realizada, estendemos o método Sparse linear method with side information (SSLIM), que considera as modalidades de informação acima mencionadas e o comparamos com o KNN que aqui representa o baseline a ser superado. Neste trabalho, propomos uma abordagem que explora a informação visual e textual para descrever adequadamente vídeos no nosso sistema de recomendação. Os resultados experimentais obtidos em uma coleção real de vídeos, com 207.154 vídeos do Youtube mostra que foi possível melhorar até 7%, quando comparado com uma única modalidade e de 13% sobre o baseline, demonstrando a eficácia da abordagem proposta e destacando a utilidade da informação multimodal quando se lida com o problema de Cold-Start.@pt


This work addresses the development of a new multimodal approach to deal with the cold-start problem in video recommender systems. Given a video document, which usually consists of a sequence of images, audio and related information (such as title, tags and description), video recommendation is formulated as finding a list of the most relevant videos to target users. The cold-start problem is caused when there is no information about the user (cold-start user) or the item (cold-start item) when recomending an item. More specifically, our approach considers two information modalities: (i) visual (color and facial information) and (ii) textual (tags, title, and description) information. To qualify the recommendation performed, we extend a Sparse linear method with side information (SSLIM), which takes into account the aforementioned information modalities. In this work, we propose an approach that exploits visual and textual information to properly describe videos in our recommender system. Experimental results obtained on a real dataset containing 207.154 videos from Youtube shows that we could improve up to 7% when comparing to a single modality model and up to 12% when compared to the baseline, demonstrating the effectiveness of the proposed approach and highlighting the usefulness of multimodal information when dealing with the cold-start problem.@en

. Metodologia para recomendação de vídeos baseada em descritores de conteúdo visuais e textuais methodology for video recommendation based on descriptors visual content and textual. Tendências da pesquisa brasileira em ciência da informação, [????].
NLP0.29
Visto 9 vezes
sem referências
Array
(
    [dateOfAvailability] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [2016-01-01] => 47273
                        )

                    [1] => Array
                        (
                            [2016-01-04] => 151672
                        )

                )

        )

    [hasAuthor] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [Felipe Leandro Andrade da Conceicao] => 119619
                        )

                    [1] => Array
                        (
                            [Flavio Luis Cardeal Padua] => 119620
                        )

                    [2] => Array
                        (
                            [Adriano Cesar Machado] => 119621
                        )

                    [3] => Array
                        (
                            [Anisio Mendes Lacerda] => 119622
                        )

                    [4] => Array
                        (
                            [Daniel Hasan Dalip] => 119623
                        )

                )

        )

    [hasFileStorage] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [_repository/257/2019/09/oai_brapci_inf_br_article_21591#00015.htm] => 121548
                        )

                )

        )

    [hasSectionOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Artigo científico] => 435
                        )

                )

        )

    [hasSubject] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Ciência da computação] => 269911
                        )

                    [1] => Array
                        (
                            [Visão computacional] => 119617
                        )

                    [2] => Array
                        (
                            [Recomendação de conteúdo] => 191953
                        )

                )

        )

    [isPartOfSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Tendências da Pesquisa Brasileira em Ciência da Informação] => 257
                        )

                )

        )

    [hasIssueOf] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [ISSUE:JNL:00015-2016-9-1] => 119604
                        )

                )

        )

    [hasAbstract] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Este trabalho aborda o desenvolvimento de uma nova abordagem multimodal para lidar com o problema de cold-start em sistemas de recomendação de vídeos. Dado um documento de vídeo, que geralmente consiste de uma sequência de imagens, áudio e informações relacionadas – como o título, tags (rótulos) e descrição –, a recomendação de vídeos visa encontrar uma lista dos vídeos mais relevantes para direcionar os usuários. O problema de cold-start é ocasionado quando, ao recomendar um item, não se possui informações sobre o usuário (cold-start user) ou sobre o item (cold-start item). Mais especificamente, nossa abordagem considera duas modalidades de informação: (i) visual (informações de cor e facial) e (ii) textual (tags, título e descrição) de informação. Para avaliar a recomendação realizada, estendemos o método Sparse linear method with side information (SSLIM), que considera as modalidades de informação acima mencionadas e o comparamos com o KNN que aqui representa o baseline a ser superado. Neste trabalho, propomos uma abordagem que explora a informação visual e textual para descrever adequadamente vídeos no nosso sistema de recomendação. Os resultados experimentais obtidos em uma coleção real de vídeos, com 207.154 vídeos do Youtube mostra que foi possível melhorar até 7%, quando comparado com uma única modalidade e de 13% sobre o baseline, demonstrando a eficácia da abordagem proposta e destacando a utilidade da informação multimodal quando se lida com o problema de Cold-Start.] => 0
                        )

                    [1] => Array
                        (
                            [Este trabalho aborda o desenvolvimento de uma nova abordagem multimodal para lidar com o problema de cold-start em sistemas de vídeo de recomendação. Dado um documento de vídeo, que geralmente consiste de uma sequência de imagens, áudio e informações relacionadas – como o título, tags (rótulos) e descrição –, a recomendação de vídeos visa encontrar uma lista dos vídeos mais relevantes para direcionar os usuários. O problema de cold-start é ocasionado quando, ao recomendar um item, não se possui informações sobre o usuário (cold-start user) ou sobre o item (cold-start item). Mais especificamente, nossa abordagem considera duas modalidades de informação: (i) visual (informações de cor e facial) e (ii) textual (tags, título e descrição) de informação. Para avaliar a recomendação realizada, estendemos o método Sparse linear method with side information (SSLIM), que considera as modalidades de informação acima mencionadas e o comparamos com o KNN que aqui representa o baseline a ser superado. Neste trabalho, propomos uma abordagem que explora a informação visual e textual para descrever adequadamente vídeos no nosso sistema de recomendação. Os resultados experimentais obtidos em uma coleção real de vídeos, com 207.154 vídeos do Youtube mostra que foi possível melhorar até 7%, quando comparado com uma única modalidade e de 13% sobre o baseline, demonstrando a eficácia da abordagem proposta e destacando a utilidade da informação multimodal quando se lida com o problema de Cold-Start.] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [This work addresses the development of a new multimodal approach to deal with the cold-start problem in video recommender systems. Given a video document, which usually consists of a sequence of images, audio and related information (such as title, tags and description), video recommendation is formulated as finding a list of the most relevant videos to target users. The cold-start problem is caused when there is no information about the user (cold-start user) or the item (cold-start item) when recomending an item. More specifically, our approach considers two information modalities: (i) visual (color and facial information) and (ii) textual (tags, title, and description) information. To qualify the recommendation performed, we extend a Sparse linear method with side information (SSLIM), which takes into account the aforementioned information modalities. In this work, we propose an approach that exploits visual and textual information to properly describe videos in our recommender system. Experimental results obtained on a real dataset containing 207.154 videos from Youtube shows that we could improve up to 7% when comparing to a single modality model and up to 12% when compared to the baseline, demonstrating the effectiveness of the proposed approach and highlighting the usefulness of multimodal information when dealing with the cold-start problem.] => 0
                        )

                )

        )

    [hasID] => Array
        (
            [nn] => Array
                (
                    [0] => Array
                        (
                            [oai:brapci.inf.br:article/21591] => 0
                        )

                    [1] => Array
                        (
                            [oai:ojs.pkp.sfu.ca:article/382] => 0
                        )

                )

        )

    [hasRegisterId] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [http://www.brapci.inf.br/index.php/article/view/0000021591] => 0
                        )

                    [1] => Array
                        (
                            [https://revistas.ancib.org/index.php/tpbci/article/view/382] => 0
                        )

                )

        )

    [hasSource] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Tendências da Pesquisa Brasileira em Ciência da Informação, v. 9, n. 1, 2016.] => 0
                        )

                    [1] => Array
                        (
                            [Tendências da Pesquisa Brasileira em Ciência da Informação; v. 9 n. 1 (2016)] => 0
                        )

                    [2] => Array
                        (
                            [1983-5116] => 0
                        )

                )

        )

    [hasTitle] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Metodologia para recomendação de vídeos baseada em descritores de conteúdo visuais e textuais] => 0
                        )

                )

            [en] => Array
                (
                    [0] => Array
                        (
                            [Methodology for video recommendation based on descriptors visual content and textual] => 0
                        )

                )

        )

    [hasUrl] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [URL:http://inseer.ibict.br/ancib/index.php/tpbci/article/view/229] => 0
                        )

                    [1] => Array
                        (
                            [https://revistas.ancib.org/index.php/tpbci/article/view/382/382] => 0
                        )

                )

        )

    [prefLabel] => Array
        (
            [pt] => Array
                (
                    [0] => Array
                        (
                            [Oai:brapci.inf.br:article/21591#00015] => 0
                        )

                )

        )

)