ADD ANYTHING HERE OR JUST REMOVE IT…
Blog, Inteligência Artificial Blog

Amazon Web Services: Converta documentos e mídia utilizando Inteligência Artificial

Amazon Web Services: Segundo a Pesquisa Nacional de Saúde (PNS), em 2019, na população do país com 2 anos ou mais de idade, 3,4% (ou 6,978 milhões) tinham deficiência visual e 1,1% (ou 2,3 milhões) tinham deficiência auditiva, e conforme a Lei Brasileira de Inclusão da Pessoa com Deficiência (Lei 13.146), que torna obrigatória a acessibilidade nos sítios da internet mantidos por empresas com sede ou representação comercial no País ou por órgãos de governo, porém de acordo com a matéria da CNN Brasil, mostra que o número de sites brasileiros aprovados em todos os testes de acessibilidade representa menos de 1% do total.

Criar uma solução acoplável, para que empresas e órgãos, possam gerar documentos e mídias para dar acessibilidades aos seus usuários é o que abordaremos nesse blog post.

A solução abaixo, demostra uma arquitetura com serviços serverless para a construção e funcionamento de um website estático que está no Amazon S3, onde será possível inserir documentos e mídias, e com o AWS Step Function para orquestrar os serviços inteligência artificial para conversão dos documentos e mídias para acessibilidade, e por final armazena as informações no Amazon Opensearch para facilitar a busca desses documentos.

Visão Geral da Solução


Figura 1 – Diagrama da solução

Upload dos documentos e videos

website está hospedado pelo Amazon CloudFront, assim que é feito o upload dos arquivos eles são salvos no Amazon S3, que dispara um evento pelo Amazon EventBridge que inicializa o workflow do AWS Step Functions. Foi criado uma máquina de estados para validar o processamento e armazenamento dos documentos e mídias.

Workflow Step Functions:
1 – Valida o tipo de arquivo
2 – Caso PDF, o Textract será iniciado.
2.1 – Extrai o texto impresso de qualquer documento.
2.2 – Salva a extração no Amazon S3
2.3 – Obtém o texto salvo na extração e envia para o Amazon Polly
2.4 – Converte o texto para fala e salva no Amazon S3 o arquivo
2.5 – Lambda envia para o Amazon OpenSearch Service os dados dos arquivos para que possa ser feito a busca
3 – Caso mp4 o Amazon Transcribe será iniciado.
3.1 – Converte automaticamente a fala do arquivo em texto
3.2 – Salva a conversão no Amazon S3
3.3 – Lambda envia para o Amazon OpenSearch Service os dados da mídia para que possa ser feito a busca

Pesquisa dos arquivos

Quando o usuário realiza a busca no site, é feita uma chamada na api do Amazon API Gateway que inicializa um AWS Lambda responsável por fazer a busca no Amazon OpenSearch Service, que irá retornar ao website todos os dados relacionados a busca.


Figura 2 – Resultado da busca

Foi utilizado também o Cognito, para o login dos usuários no website e controle de acesso para as chamadas da api, além do CloudWatch para logs e métricas e o AWS X-RAY para observabilidade da máquina de estados.

Conclusão e próximos passos

Com a utilização dos serviços de inteligência artificial como Textract extrair texto de arquivos pdfs, Polly converter texto em fala e o Transcribe que converte a fala para texto, possibilita que as organizações possam desenvolver soluções de busca que tenham mais acessibilidade para seus usuários.

Artigo originalmente publicado por Blog AWS

DNX Brasil – Soluções cloud-native

Sidebar Scroll To Top
Facebook Instagram YouTube linkedin