(Portuguese) A originalidade das palavras. Uma análise especulativa.
Jun 12th
Encontrei este texto escrito há algum tempo, e resolvi testar a hipótese agora:
Eu acredito que as caracteristicas de uma etnia são reflectidas na sua lingua, na medida em que esta reflecte a etnia e as mudanças que a etnia sofreu ao longo do tempo.
Por exemplo, uma palavra de uso comum por uma população, normalmente adquire uma versão curta na lingua dessa população.
Eu proponho que se encontre as palavras com menor numero de silabas em todas as linguas, digamos, uma lista com palavras de até 3 sílabas de todas as linguas, com o significado correspondente.
A cada palavra de até 3 sílabas atribui-se o significado/significados de uso corrente e comum.
Depois removia-se da tabela todas as palavras em todas as linguas que tivessem o mesmo significado/significados de uso corrente e comum, ficando apenas em cada línguas as que identificam a lingua e portanto a etnia.
Isto poderia ser feito de modo automatico, com um dicionário multilingue.
O Plano:
1) pegar numa data de dicionários (lingua->inglês) e para cada ficheiro criar uma tabela palavra – significado
2) eliminar simultaneamente todas as linhas de palavra em todos os ficheiros que tivessem ocorrencia de significado similar
Claro que assim a lingua inglesa serviria de meio de análise, e não poderia ser analisada.
Mas isso pouco importa, visto que a lingua inglesa é tão usada e deturpada hoje em dia, em uso comum por várias etnias que talvez nao fosse de interesse analisá-la. Isto tambem se a línguas mais faladas, mas em menor escala e gravidade.
3) por análise extensiva e especializada poder-se ia criar uma atributo denominado “conotação intraduzivel” que tornaria a palavra imediatemente “identificadora da lingua”.
Poder-se-ia limitar este atributo a cerca de 20 palavras por lingua (valor meramente arbitário e deverá ser alterado para a ordem de grandeza obtida depois do processo automatizável referido nos passos 1,2 e 3)
Segundo o modelo descrito acima, vamos precisar de dicionários do género:
- lingua A -> inglês
- lingua B – > inglês
- lingua C -> inglês
Em que o inglês é tratado como língua de analise.
Em seguida o que se faz é começar a varrer os significados das palavras.
A ideia é, para uma dada palavra Ap com significado IngAp no dicionário A->Ing encontrar todas as palavras com o mesmo ou similar significado em todos os dicionários.
Caso haja algum duplicado, simplesmente apagar todas as ocorrências das palavras nesses dicionários. O objectivo é encontrar palavras cujo significado seja único em todas as línguas.
Definir similaridade:
Hipotese: A similaridade de palavras em duas línguas diferentes é definida pela semelhança entre os seus significados.
- Seja Ap uma palavra no dicionario A->Ing com significado IngAp
- Seja Bp uma palavra no dicionário B->Ing com significado IngBp
Pergunta: Quando é que as duas palavras são iguais, segundo a nossa hipotese?
Resposta: Quando a lista dos significados em inglês é igual. Ou seja, são 100% similares.
E caso não sejam totalmente iguais?
Vamos imaginar que Ap é uma palavra cuja tradução IngAp é água, ar ou terra
Ou seja, Ap é uma palavra numa dada lingua que quer dizer água,ar ou terra quando traduzida para inglês.
Bp é uma palavra cuja tradução IngBp é água ou fogo.
Qual é a similaridade entre Ap e Bp ?
IngAp partilha 1 palavra em 3 com IngBp : água
IngBp partilha 1 palavra em 2 com IngAp : água
IngAp é 1/3 similar a IngBp e IngBp é 1/2 similar a IngAp
Se assumirmos estas fracções como probabilidades de uma palavra ser igual à outra, então a probabilidade de Ap ser igual a Bp é 1/3 * 1/2 ou 1/6 .
A similaridade entre Ap e Bp é de cerca de 17%
A similaridade está então definida como sendo a probabilidade das palavras serem iguais, o que corresponde à multiplicação das fracções de significados partilhados entre as palavras.
Podemos então criar um programa que percorre dicionários e encontra, para cada palavra em cada dicionário, todas as palavras que estão abaixo de um patamar de similaridade. Ou seja todas as palavras que são únicas e características a uma dada lingua.
Passos experimentais:
1) Fazer download a dicionários;
2) Programar um algoritmo de acordo com os príncipios citados e corrê-lo sobre os dicionários.
Optou-se por fazer download dos dicionários lingua->inglês do projecto Universal Dictionary com um formato padrão. http://www.dicts.info/ud.php
Em seguida, programou-se a aplicação e fez-se correr o algoritmo.
Nesta simulação, vamos apresentar meramente o resultado da comparação entre os dicionários correspondentes ás linguas latinas, já que o algoritmo é algo moroso:
Escolhemos os dicionários de:
Espanhol, Francês, Italiano, Português, Romeno -> inglês
Popularity: 7% [?]
Cleaning Hotmail / Messenger / Windows Live Contacts
Mar 11th
Tutorial:Cleaning up Windows Live Messenger (or MSN Messenger or Windows Messenger) contacts.
May 31, 2010
Abstract
Overtime, MSN Messenger contact lists get cluttered.
Usually because of spammers, friends that change or lose their e-mail, or contacts you no longer talk to.
Yes, you can organize them into groups, and you can block them. But the MSN protocol and all the evolutions it has suffered have left some serious room for messiness.
This tutorial tries to explain the basics for cleaning your MSN contacts.
Preparation:
You should login to your Live Messenger account and change your password (for safety reasons, but you can skip this step)
Login to http://home.live.com and click options. Then account options or change password. Change your password into something temporary for this tutorial.
The Steps:
1 List Rebuilder Tool:
Go to http://www.msngeeks.com/msn and use their List Rebuilder Tool
From the site: «This tool will delete all unnecessary contacts in your allow and block lists. Unnecessary being contacts you’ve deleted from your forward list, and who have also deleted you from their forward list.»
2 Miranda IM Contact Tool:
2.1 Download and install Miranda Instant Messenger:
Miranda is a MultiProtocol IM that comes with a useful tool.
Popularity: 45% [?]
Internet tidbits
Feb 17th
Little online lessons in the form of pictures. Screenshots from here and there.
1 – Information easily hides subliminal messages. Find the hidden message;
Information comes in all forms and usually in very small packages. It’s very easy to get lost and to loose things.
2 – The internet is something with a global character. A more and more evident character;
Popularity: 17% [?]
Chinese, so easy!
Feb 16th
using-boxers-with-swimn-trunks-fashion: Explained
Sep 19th
Kids wearing boxers inside swim-trunks. Why do they do it. This explains why. Sort of.
Popularity: 47% [?]
The Fourrier Transform
Sep 19th

This one is a bit far fetched, so for an explanation: it’s a pun on the European military rank Fourier and the mathematical Fourier Transform.
Popularity: 16% [?]
Song Translations: doismileoito – Acordes Com Arroz
Aug 5th
Inside me something
Keeps me from loving the sun.
I see it merely as light,
Merely as sun.
I want the rain and the cold
So in given time,
I’ll value your warmth.
Afraid of the early nightfall.
When I feel the cold,
I fear not feeling at all.
Who cares what’s good,
If there is no evil.
Just as faces in a postcard,
Don’t want it like this
But I am like this.
I fear the evil, but want it again.
More than a worn shoe,
I feel this is the end.
Bury all the pain and bones in your garden,
Ask the sky for some clouds to harden.
Popularity: 16% [?]
Online Radio – usage and alternatives to last.fm – A guide for Europe
Jul 31st
The story goes as this:
last.fm was a very cool website. It was free, it was hip, it kept getting better.
Add a few years and the free part is dropped out, as it often happens.
What does this wonderful site have that makes it so wonderful and worth me writing about it?
All it did, or its core fuction is to gather information about its users listening habits. What do you listen to and when do you listen to it. From that it does the following:
- Customized radios: you can pick a genre, friend, yourself or an artist, and it will play either songs that are related to what you picked or simply popular concerning what you picked. This means that with the click of a button you can listen to your friends music collection. Or even, you could listen to a radio composed of your favorites songs. Or even just listen to radio that plays music you don’t know, based on your tastes in regard to other similar users.
- Recommendations: As mentioned before, last.fm can pickup what you like. It then finds similar users and recommends to you the stuff that they like, and that you don’t know about. It’s likely that this way you will find new music that you enjoy. Also, it will recommend concerts of band, based on your taste. A very popular feature, specially for Erasmus students and the like :O
And its basically this that makes last.fm so cool: costumized radios and recommendations.
Popularity: 16% [?]
The Portuguese flag tryout
Jul 23rd
Was here pondering about this problem. You see, there are these things called flags…
and i was wondering about them. In particular about flags i am familiar with.
Are flags important? You bet they are. As Eddie Izzard puts it, “no flag no country“. You can’t declare you are a nation without a nation flag or something of the sort.
From here, i could go on and debate (or whatever you do when you talk to yourself) on what exactly is a country. But i’ll stick to flags as a symbol of a country.
And since there is a whole scholarly study dedicated to flags, I’ll restrict myself and stick to a flag i am familiar with.
Presenting, the Portuguese flag:

Interesting isn’t it?
Popularity: 100% [?]
(Portuguese) Kashkabald a Lenda
Jul 23rd
Organize your mp3 collection – tutorial – in works
Jul 23rd
Fullmooninu Tutorials – Music (but mostly MP3) Organizing
Well, i was messing around after purchasing MusicIP and figured i should alter this massive wall of text to something less scary.
So i was thinkingi should make two versions.
So… here’s the thing, im gona actually produce a light tutorial on music organizing, all centered on MusicIP. MusicIP is like, ossum, and puts everything else the web has to offer out on a corner.
I’ll try to explain why. As in the previous version of this tutorial it had little exposure.
Alpha Quick and Dirty Version
Okay Guys, I was telling some of you folks i would write some tutorials for this and that.
So here’s what, im going to do one right now… watch it grow while i use this forum as an excuse for the hiatus
This tutorial is for anyone who has a large (messy) music collection and wants to learn the basics to keeping such a collection organized, and use all that organizing to your personal benefit.
It’s mainly directed to the organizing of MP3 files, mostly because thats what the gross of my collection is, and because MP3 files, still present a very good quality/size ratio – specially when you are speaking about a LameMP3 encode at 192kbps
(which is what i consider the current “sweet spot” for audio files, by the way)
Popularity: 75% [?]
First post
Jul 23rd
I do a lot of stuff on the inter-webs. Me and a couple of other people. Mostly useless stuff. Some of it is very far-fetched, and i recon we have accumulated some useful knowledge.
This is the place where we will post some of that stuff.
There are a couple of rules we will use:
1) we don’t do it for popularity
2) don’t’ post about posts
3) original articles first
4) avoid reviews
5) avoid talking about recent events
6) avoid the hype
new rules will appear
Popularity: 20% [?]

