![]() | |
|
O QuantoCanto é o primeiro e único sistema para aparelhos de karaokê no mundo que avalia o canto do usuário tomando três parâmetros para medição da performance, ritmo, afinação e potência da voz. A maioria dos sistemas de avaliação do canto, disponível no mercado, tem como parâmetro somente a potência de voz do usuário. Para atribuir a nota ao usuário, o QuantoCanto compara a voz do cantor com a voz da música original, por meio da ponderação dos três parâmetros: ritmo, afinação e potência de voz. Outra vantagem do sistema é poder ser instalado em qualquer equipamento que tenha a função Karaokê. O produto estará disponível no mercado em novembro. Em três anos de trabalho o Genius Instituto de Tecnologia do Amazonas submeteu ao INPI três pedidos de patentes e dois registros de computador, além de um pedidod e patente nos Estados Unidos e um ao Japão. Os produtos são: um dispositivo e método de avaliação de desempenho de canto; sistema eletrônico para extração não assistida de objetos em imagens dinâmicas com função não homogênea em tempo real e método e dispositivo de segurança acionado por sons. Por ser um centro tecnológico o Genius não possui cardápio fixo de produtos para o consumidor final mas sim um conjunto de tecnologias e plataformas inovadoras que são transferidas ou licenciadas para empresas nacionais e internacionais para comercialização. O Genius ganhou o segundo lugar na categoria Instituição de Pesquisa da região Norte do Prêmio Finep 2004. O sistema QuantoCanto recebeu o Prêmio Finep 2002 categoria Produto, região Norte. A patente PI0202561-2 refere-se a "DISPOSITIVO E MÉTODO DE AVALIAÇÃO DE DESEMPENHO DE CANTO". Baseado em um dispositivo de entrada que fornece uma seqüência de blocos de amostras de um sinal de voz do cantor a ser avaliado e uma seqüência de blocos de amostras de um sinal de voz de referência e na medição da similaridade entre os sinais fornecidos pelo dispositivo de entrada através do processamento de múltiplos aspectos, e que prevê um dispositivo de saída de informações a serem usadas para a geração de uma realimentação visual e auditiva com objetivo didático dos resultados parciais das referidas comparações e de uma realimentação visual e auditiva com objetivo didático do resultado final da referida avaliação de similaridade e do sumário da avaliação de similaridade de cada um dos referidos aspectos; e um método de adaptação, que permite a adição, remoção ou modificação dos aspectos do referido conjunto de aspectos, fazendo com que o referido dispositivo seja, portanto, modular e que permite o ajuste do nível de qualidade das referidas avaliações de similaridade, realizadas com base no processamento da voz do cantor e da voz de referência, de modo a adequar as referidas avaliações de similaridade aos recursos computacionais disponiveis, fazendo com que o referido dispositivo seja, portanto, escalar. O sistema foi desenvolvido entre 2001 e 2002 no Genius Instituto de Tecnologia, em Manaus. Esta invenção foi licenciada para a empresa Gradiente Eletrônica, e envolveu o uso da capacidade de processamento ociosa do aparelho de DVD para implementar um método de avaliação mais eficiente que os demais disponíveis no mercado, por avaliar não apenas o volume do canto, mas também o ritmo e a afinação, através da comparação com a voz original, fornecendo ainda uma realimentação visual em tempo real da performance do cantor, permitindo que ele se corrija. O fato de usar a capacidade ociosa permitiu que uma nova funcionalidade pudesse ser adicionada a um produto em processo de comoditização, como um importante diferencial competitivo, permitindo a cobrança de um preço premium, mas sem custos adicionais (já que utiliza elementos já disponíveis no aparelho). Desta forma, foi possível para a Gradiente combater o forte processo de comoditização dos aparelhos de DVD Player promovido pela importação de aparelhos asiáticos. Outra invenção de Thomas Strasser na qual outros oito colegas tiveram fundamental participação é o sistema de controle remoto por voz independente do locutor, para o Português falado no Brasil. Este invento está em fase de inserção no mercado, e tem um grande potencial de auxílio a portadores de deficiência, permitindo o comando e o acionamento de funções nos mais variados aparelhos eletro-eletrônicos, através da fala. O fato de ser independente do locutor implica na ausência de necessidade de treinamento do sistema, permitindo que qualquer pessoa, independentemente do seu sexo, idade, origem e sotaque possa usar o sistema de forma simples e intuitiva. O sistema foi desenvolvido de forma a cobrir todas as variantes da língua falada no Brasil, permitindo um desempenho melhor que o de sistemas adaptados à nossa língua a partir do Inglês. O sistema de avaliação de desempenho de canto (PI0202561 e PI0404587) surgiu de uma solicitação da Gradiente de se desenvolver um diferencial competitivo para um produto em rápido processo de comoditização. O fato dos sistemas de avaliação disponíveis no mercado até então (e que continuam assim até hoje) serem muito imprecisos e causarem insatisfação nos usuários motivou o estudo de uma solução alternativa. Neste estudo, identificou-se que estes sistemas utilizavam unicamente o volume da voz do usuário como parâmetro de avaliação (dando uma nota mais alta para o usuário que cantasse mais alto). Desta forma, iniciou-se uma pesquisa de teoria musical, que determinou os principais componentes do canto: a melodia, a harmonia e o ritmo. Destes, a melodia e o ritmo, por serem mais simples e objetivos, foram escolhidos para servirem de base de avaliação. Foram então estudados métodos de medição e quantização destes parâmetros, e desenvolveu-se um protótipo do sistema. Este protótipo, apesar de não rodar em tempo real (a avaliação de uma música de alguns minutos demorava horas), demonstrou a viabilidade da proposta. A partir deste ponto, diversas técnicas de processamento digital de sinais foram necessárias para otimizar os algoritmos envolvidos no sistema, permitindo que ele rodasse em tempo real e consumisse um poder computacional suficientemente reduzido para permitir a sua implementação utilizando o processamento ocioso disponível no aparelho de karaokê. Neste trabalho, desenvolveu-se uma característica interessante de modularidade e escalabilidade do sistema, permitindo que diferentes níveis de precisão fossem alcançados em função do poder computacional disponível. Finalmente, foi feito o porte deste sistema para o processador específico do aparelho, o que exigiu um grande esforço de integração com o fabricante do processador. Eu participei ativamente na concepção do sistema, na identificação e medição dos parâmetros e na otimização dos algoritmos de medição e comparação. O sistema de controle remoto por voz (PI0405687-6) foi motivado por uma prospecção de cenários tecnológicos para a evolução das interfaces entre homens e máquinas. Como resultado desta prospecção, identificou-se a área de reconhecimento automático da fala como uma área de grande potencial. A partir de então, desenvolveu-se uma primeira prova de conceito, através do desenvolvimento de um controle remoto de aparelhos de eletrônica de consumo acionado por voz, baseado na tecnologia de reconhecimento de palavras isoladas. Com o sucesso da prova de conceito, que envolveu, na época, a participação de três pesquisadores, decidiu-se estruturar uma área de desenvolvimento da tecnologia de reconhecimento automático da fala. Foram contratados pesquisadores experientes na área vindos de empresas estrangeiras atuantes no setor, que lideraram a estruturação da equipe, que chegou a contar com cerca de 30 pesquisadores. Nesta nova etapa, as técnicas mais avançadas de reconhecimento automático da fala contínua, independente do locutor, e com diversas funcionalidades de otimização do desempenho desenvolvidas internamente no Instituto, permitiram o desenvolvimento de um sistema genuinamente nacional e competitivo com os demais sistemas existentes no mundo. Neste desenvolvimento, a minha participação se deu na prospecção inicial, no desenvolvimento da prova de conceito e no desenvolvimento de diversos módulos do sistema, como o modelo acústico, o compilador de gramática, a detecção de atividade de voz, a rejeição de palavras fora do vocabulário e o algoritmo de busca de hipóteses. O DVDokê da Gradiente foi introduzido no Mercado no segundo semestre de 2001. Até hoje, as receitas da Gradiente vindas exclusivamente do DVDokê somam mais de R$ 100 milhões e, apenas de 2004 até hoje (os valores de 2001 a 2003 eu não consegui levantar a tempo para incluir nesta resposta!), os retornos obtidos pelo Genius Instituto de Tecnologia através de royalties somam R$ 1,5 milhões.O sistema de controle remoto por reconhecimento de fala foi colocado no mercado através de licenciamento de software. Algumas empresas integradoras de sistemas já assinaram contratos de licenciamento e estão desenvolvendo seus produtos, que devem chegar ao mercado a partir de 2007. No caso do sistema de avaliação de desempenho de canto, a principal dificuldade foi o convencimento de que a solução era tecnicamente viável e a conseqüente negociação da abertura do sistema de DVD dos fornecedores de tecnologia da Gradiente, para possibilitar o porte do sistema desenvolvido pelo Genius. Esta dificuldade foi superada enviando-se os pesquisadores do Genius para implementar este porte no escritório de P&D da empresa, na Califórnia, EUA. No que concerne o sistema de controle remoto por voz, a principal dificuldade foi garantir a funcionalidade do sistema considerando a independência do locutor e os diferentes sotaques falados no Brasil. Para superar esta dificuldade, foi necessário desenvolver um sistema de mapeamento lingüístico do Português falado no Brasil, modelar uma base de dados que garantisse a cobertura fonética adequada deste mapeamento, desenvolver um sistema para automatização da tarefa de coleta de vozes, e coletar dezenas de milhares de horas de gravação de voz em todo o Brasil. O desenvolvimento do sistema de avaliação de desempenho de canto contou com a consultoria de professores do Laboratório de Processamento de Sinais da COPPE, Universidade Federal do Rio de Janeiro.O desenvolvimento do sistema de controle remoto por voz contou com a consultoria de um professor do Laboratório de Processamento de Sinais da COPPE, Universidade Federal do Rio de Janeiro, na etapa preliminar de desenvolvimento do sistema e, posteriormente, com a participação, através de consultoria, de professores da Pontifícia Universidade Católica do Rio Grande do Sul, da Universidade Federal do Rio Grande do Sul, e de alunos da Universidade Estadual de Campinas. O Genius Instituto de Tecnologia foi criado em novembro de 1999, pela iniciativa privada, para dedicar-se a pesquisa e ao desenvolvimento com foco em inovações tecnológicas nas áreas de eletro-eletrônica, microeletrônica, software e software embarcado. Seu principal cliente é a empresa brasileira Gradiente Eletrônica S/A. O Ministério da Ciência e Tecnologia é parceiro do Genius na elaboração e execução do Programa Nacional de Microeletrônica. A maior característica do instituto é atuar em projetos e plataformas tecnológicas, suprindo as necessidades de seus clientes e parceiros. Tudo isso, sem fins lucrativos. O maior patrimônio do Genius é a sua equipe altamente qualificada. São cerca de 150 colaboradores, dos quais aproximadamente 10% são doutores e 50% mestres ou mestrandos, vindos de vários estados brasileiros e de outros paises, de empresas nacionais e multinacionais. A parceria entre o Genius e a Universidade Federal do Amazonas, UFAM, criou o primeiro, e ainda único, Mestrado em Informática da região Norte do País. A primeira turma iniciou o curso em agosto de 2001, e atualmente o curso já se encontra na quarta turma. Este curso, antes mesmo da formação da primeira turma, recebeu o credenciamento oficial da CAPES, e é uma contribuição do Genius à sociedade manauense. Thomas Strasser é formado em Engenharia Elétrica – Ênfase em Automação e Controle pela Escola Politécnica da Universidade de São Paulo – EPUSP Conclusão: Dez/00, com Mestrado em Informática – Reconhecimento Automático da Fala Universidade Federal do Amazonas – UFAM Conclusão: Fev/04 e Especialização – Gestão Estratégica da Inovação Tecnológica Universidade Estadual de Campinas – UNICAMP. Trabalhou no Laboratório de Engenharia Biomédica – LEB/EPUSP (Set/98 – Dez/99) e ingressou no GENIUS Instituto de Tecnologia em Fev/01. Em setembro de 2002 recebeu o Prêmio Finep de Inovação Tecnológica – Região Norte “Sistema QuantoCanto”, Avaliação de Desempenho de Canto, 1o lugar da categoria Produto Fonte: http://www.finep.gov.br/premio/folhas_inovacao_premio_2004/norte_tela.pdf http://www.genius.org.br/ http://www.genius.org.br/observatorio_noticias_finep_set2002.htm acesso em julho de 2005 Agradeço ao INPI/FINEP pelo envio de informações em junho de 2008 para composição desta página envie seus comentários para otimistarj@gmail.com. |