Teorema

A Hipótese Generalizada do Contínuo Implica o Axioma da Escolha

Samuel Gomes da Silva e Diego Lima Bomfim

Introdução

O Axioma da Escolha surgiu “oficialmente” em 1908 a partir da publicação, por Ernst Zermelo, de dois trabalhos (Zermelo 1908a, 1908b) que marcaram o início da axiomatização da Teoria dos Conjuntos, tendo sido utilizado pela primeira vez quatro anos antes pelo mesmo autor em sua demonstração de que todo conjunto pode ser bem ordenado (Zermelo 1904) – que por sua vez é conhecido como Teorema da Boa Ordenação (denotado por \(\mathbf{WO}\), de Well-Ordering Theorem).

Devido ao seu caráter não-construtivo, \(\mathbf{AC}\) (como é geralmente denotado o Axioma da Escolha – advindo de Axiom of Choice) foi, e ainda é, alvo de muita discussão e polêmica: afinal, ele garante ao trabalhador matemático a tentadora possibilidade de fazer infinitas escolhas arbitrárias. Em termos simples, ele garante que dada uma família de conjuntos não-vazios sempre é possível obter um conjunto que tem exatamente um elemento escolhido em cada conjunto da família, no que se diz que toda família de conjuntos não-vazios admite uma função-escolha1.

Tal axioma tem aceitação bastante variada, a depender do ramo da matemática e do contexto em que se aplica. Por um lado, admite várias implicações (ou mesmo equivalências) muito conhecidas e importantes, de peso central em várias áreas da Matemática – equivalências como o Lema de Zorn, o Teorema de Krull  sobre a existência de ideais maximais em anéis comutativos com unidade (da Álgebra), e o Teorema de Tychonoff   2 (da Topologia Geral), e consequências como o Teorema do Ultrafiltro, ou o Teorema de Hahn-Banach (da Análise Funcional). Por outro lado, o Axioma da Escolha também implica alguns resultados bastante contraintuitivos, como o famoso Paradoxo de Banach-Tarski, o qual demonstra ser possível dividir uma esfera tridimensional em um número finito de peças e reorganizá-las (usando apenas movimentos rígidos) de modo a formar duas esferas do mesmo tamanho que a original.

Não obstante, temos que \(\mathbf{AC}\) é independente dos axiomas da teoria dos conjuntos usual, a chamada Teoria dos Conjuntos de Zermelo-Fraenkel — denotada por \(\mathbf{ZF}\) —, o que significa que ele não pode ser provado nem refutado a partir dos axiomas básicos da teoria. Devido a isso, o axioma da escolha é considerado um axioma adicional, culminando na axiomática \(\mathbf{ZFC}\) dada por \(\mathbf{ZF}+\mathbf{AC}\), a Teoria dos Conjuntos de Zermelo-Fraenkel com o Axioma da Escolha.

Já a Hipótese do Contínuo — conjecturada por Cantor nos anos 1880, e muito provavelmente a mais célebre asserção matemática cuja independência de \(\mathbf{ZFC}\) já foi demonstrada — declara que, dado um subconjunto infinito da reta real, então devemos ter que este conjunto está em bijeção ou com o conjunto dos números naturais ou então com a própria reta.

O contexto que levou Cantor a enunciar tal conjectura (à qual vamos nos referir como \(\mathbf{CH}\), de Continuum Hypothesis) foi resultado de uma série de tentativas fracassadas de exibir algum subconjunto da reta com cardinalidade intermediária entre \(\aleph_0\) (a cardinalidade de \(\mathbb{N}\)) - e \(\mathfrak{c}\) (o continuum, a cardinalidade de \(\mathbb{R}\)), o que culminou na sua hipótese de que tal feito seria impossível: uma questão tão importante à época que ocupou a primeira posição na lista dos famosos 23 problemas de Hilbert, na virada para o século XX.

Assim, \(\mathbf{CH}\) pode ser traduzido em uma linguagem mais técnica de teoria dos conjuntos (assumindo o Teorema da Boa Ordenação)3 como a afirmação de que não existe nenhum cardinal intermediário entre \(\aleph_0\) e \(2^{\aleph_0}\) (sendo este último cardinal igual a \(\mathfrak{c}\), já que tem a mesma quantidade de elementos do que o conjunto das partes de \(\mathbb{N}\) - sendo este último, por sua vez, equipotente ao conjunto \(\mathbb{R}\) dos números reais, sendo que a existência dessa bijeção não depende do Axioma da Escolha).

As consequências dos estudos sobre a Hipótese do Contínuo são bastante numerosas, o que levou por exemplo à sua natural generalização, a chamada Hipótese Generalizada do Contínuo (\(\mathbf{GCH}\), de Generalized Continuum Hypothesis), a qual (assumindo novamente a boa ordenação dos conjuntos) é a afirmação de que, assim como no caso anterior, não existe nenhum cardinal na lacuna entre qualquer cardinal \(\aleph_\alpha\) e o cardinal \(2^{\aleph_\alpha}\).

Embora a prova da independência de \(\mathbf{CH}\) tenha vindo apenas em 1963, no contexto da invenção do métodode forcing por Paul Cohen — independência essa que complementou um trabalho anterior de Kurt Gödel de 1940 —, um resultado de 1947 devido a Sierpiński (Sierṕinski 1947) pulula aos olhos: ele estabelece que \(\mathbf{GCH}\), que mimetiza a organização suprema dos cardinais, acaba tendo poder dedutivo o suficiente para implicar o Axioma da Escolha. Neste artigo veremos a prova desta implicação com uma demonstração um pouco diferente da original de Sierpiński, dado que a demonstração a ser apresentada utiliza o Teorema de Specker.

Primeiras Definições

Para fixar as ideias vamos dar enunciado formal para algumas das asserções que comentamos:

Axioma da Escolha (AC): O produto cartesiano de conjuntos não vazios é um conjunto não-vazio.4
Teorema da Boa Ordenação (WO): Todo conjunto pode ser bem-ordenado.5
Lema de Zorn (ZL): Toda ordem parcial não-vazia na qual toda cadeia é limitada superiormente admite um elemento maximal.

Mostra-se que tais asserções são logicamente equivalentes em \(\mathbf{ZF}\) (uma demonstração em português desse fato pode ser vista em (Jesus and Silva 2007)); no entanto, devido à ampla utilização de \(\mathbf{AC}\), à muito menor utilização de \(\mathbf{WO}\) e dificuldade de compreensão inicial do enunciado de \(\mathbf{ZL}\), existe uma famosa anedota (atribuída ao matemático norte-americano Jerry Bona) na qual se diz que o Axioma da Escolha é obviamente verdadeiro, enquanto o Teorema da Boa Ordenação é obviamente falso e “quem pode dizer alguma coisa sobre o Lema de Zorn?”.

A difusão desta piada mostra como a noção intuitiva pode ser traída pela rigidez matemática, uma vez que a equivalência das asserções, embora clara, é motivo de muita polêmica no meio matemático.

Devido à referida equivalência entre \(\mathbf{AC}\) e \(\mathbf{WO}\) e à nossa futura definição de cardinalidade, em boa parte das situações vamos querer comparar conjuntos sem ter que falar de suas cardinalidades – já que, sendo o Teorema da Boa Ordenação uma equivalência do Axioma da Escolha, assumir que todo conjunto tem alguma cardinalidade (em sua definição usual, a qual será apresentada mais adiante mas que somente se aplica a conjuntos que possam ser bem ordenados) acaba sendo equivalente a assumir o Axioma da Escolha, o que muitas vezes queremos evitar.

Com vistas a comparar a quantidade de elementos de conjuntos que não necessariamente possam ser bem ordenados, apresentamos as seguintes definições: dizemos que um conjunto \(x\) é dominado por um conjunto \(y\) (denotado por \(x \preccurlyeq y\)) se existe uma função \(f\colon x\rightarrow y\) que é injetiva, e dizemos que \(x\) é equipotente a \(y\) (denotado \(x \approx y\)) se existe uma função \(f\colon x\rightarrow y\) que é bijetiva.

Depreende-se desta definição que dizer que um conjunto é dominado por outro significa intuitivamente pensar que “aquele tem tamanho menor do que este”. Como indício positivo dessa intuição temos o famoso Teorema de Cantor-Bernstein-Schröder (o qual o primeiro autor deste artigo prefere, como também em outras referências disponíveis na literatura, enunciar como “Teorema de Schröder-Bernstein-Cantor” – de modo que sua sigla se torne S.B.C., ao que se segue uma anedótica alusão à cidade de São Bernardo do Campo, em São Paulo, seu Estado originário).

Teorema. (\(\mathbf{ZF}\))6 S.B.C. - Schröder-Bernstein-Cantor. Se \(a\) e \(b\) são conjuntos tais que \(a\) é dominado por \(b\) e \(b\) é dominado por \(a\) então temos que \(a\) é equipotente a \(b\).

Para podermos avançar e definir a cardinalidade de um conjunto (o que será feito em breve, após cuidadosa preparação), precisamos primeiro introduzir o conceito de números ordinais, os quais podem ser entendidos como uma generalização dos números naturais e que são utilizados para descrever a estrutura de qualquer conjunto que possa ser bem-ordenado.

Formalmente, um ordinal é um conjunto \(x\) que satisfaz duas condições: ele é transitivo — isto é, sempre que valer \(z \in y \in x\) tem-se \(z \in x\) (ou, equivalentemente, \(\bigcup x \subseteq x\)) — e é bem-ordenado pela própria relação de pertinência, \(\in\). A partir desta definição, adota-se uma notação bastante intuitiva: ordinais são indicados por letras gregas minúsculas (\(\alpha, \beta, \gamma\), etc.) e a relação de ordem \(\in\) é denotada pelo símbolo \(<\), de modo que se escreve \(\alpha < \beta\) em vez de \(\alpha \in \beta\). Uma consequência fundamental desta estrutura é que um ordinal coincide com o conjunto de todos os ordinais menores do que ele; ou seja, para todo \(\alpha\) vale que \(\alpha = \{\beta \mid \beta < \alpha\}\). É precisamente esta propriedade que confere aos ordinais seu papel como representantes canônicos das boas ordens, no sentido de que toda boa ordem é isomorfa a um (e único) ordinal.

Os ordinais finitos, nesta construção, são exatamente os números naturais de von Neumann: \(0\coloneq\emptyset\),\(1\coloneq\{0\}\), \(2\coloneq\{0,1\}, \ldots, n\coloneq\{0,1,2,\ldots,n-1\}, \ldots~\). Consequentemente, o menor ordinal infinito é \(\omega\), que é o próprio conjunto de todos os números naturais.

Finalmente, podemos introduzir a noção de cardinalidade (a qual pode ser bastante difícil de lidar, no caso de conjuntos que não possam ser bem-ordenados). Se por algum motivo (ainda em \(\mathbf{ZF}\), digamos !) sabemos que um conjunto \(x\) pode ser bem ordenado, podemos definir a cardinalidade de \(x\) como sendo o menor ordinal que é equipotente a \(x\), o qual denotamos por\(|x|=\min{\{\alpha\mid x\approx\alpha\}}\)7. A partir daí, um ordinal \(\alpha\) será dito um cardinal exatamente quando tiver a si mesmo como sua cardinalidade, ou seja, se \(|\alpha|=\alpha\).

Além disso, observamos que dados \(a\) e \(b\) conjuntos, denotamos por \(^ab\) o conjunto das funções de \(a\) em \(b\), e supondo que \(^a b\) possa ser bem ordenado (assunção essa que vale trivialmente sob \(\mathbf{AC}\), dado que este último é equivalente a \(\mathbf{WO}\)), temos que a cardinalidade de \(^ab\) é dada justamente pela cardinalidade de \(b\) elevada a cardinalidade de \(a\).

Esta última definição tem importante destaque no caso particular no qual \(b=2 (=\{0,1\})\) , pois sabemos que o conjunto das partes de um conjunto \(a\) qualquer está sempre em bijeção com o conjunto das funções de \(a\) em \(2\), ou seja, vale que \(^a2\approx\mathcal{P}(a)\). Traduzida para a linguagem de cardinais, obtemos a bem conhecida igualdade \(2^\kappa = |^\kappa 2| = |\mathcal{P}(\kappa)|\) para qualquer cardinal \(\kappa\), finito ou infinito.

Em nosso contexto, destacamos duas ferramentas matemáticas que nos permitem trabalhar, em \(\mathbf{ZF}\), com o “tamanho” de conjuntos sem ter que falar de cardinalidades (em particular, sem ter que discutir se tal conjunto pode ou não ser bem ordenado): a primeira é o Teorema de Cantor — cuja demonstração utiliza o famoso Argumento Diagonal de Cantor —, o qual afirma que para qualquer conjunto \(x\) vale que \(x\) é estritamente dominado pelo conjunto das suas partes (\(x\prec\mathcal{P}(x)\)), isto é, temos que existe uma injeção de \(x\) em \(\mathcal{P}(x)\), mas que nenhuma injeção pode ser sobrejetiva. Já a segunda é o chamado número de Hartogs, que permite comparar um conjunto \(x\) com os números ordinais mesmo que \(x\) não possa ser bem ordenado: dado \(x\) conjunto qualquer, o número de Hartogs de \(x\) é, exatamente, o menor ordinal \(\beta\) tal que \(\beta\) não pode ser injetado em \(x\) (\(\newcommand{\npreccurlyeq}{\rlap{\preccurlyeq}{\;|}\;}\beta\npreccurlyeq x\)); denotamos este menor ordinal simplesmente por \(H(x)\)  8.

cantor

Embora a última definição possa ser aplicada a qualquer conjunto, temos um fenômeno interessante caso esse conjunto possa ser bem ordenado: de fato, se \(\kappa\) é um cardinal, então \(H(\kappa)\) é o menor cardinal que não é menor ou igual a \(\kappa\), ou seja, \(H(\kappa)\) é (pela tricotomia dos ordinais) o menor cardinal que é maior que \(\kappa\), ou seja, é o cardinal sucessor de \(\kappa\). Esta observação nos permite definir recursivamente (por recursão transfinita sobre os ordinais) a chamada Hierarquia dos Alephs: definimos \(\aleph_0\coloneq\omega\), o menor cardinal infinito; dado um ordinal \(\alpha\) e seu correspondente \(\aleph_\alpha\) já definido, definimos \(\aleph_{\alpha+1}\coloneq{\left(\aleph_\alpha\right)}^{+}\), onde \({\left(\aleph_\alpha\right)}^{+}\) é, pelo que vimos, \(H(\aleph_\alpha)\); por fim, dado um ordinal limite9 \(\gamma\) definimos \(\aleph_\gamma\coloneq\sup{\{\aleph_\alpha\mid\alpha<\gamma\}}\).

Além disso, é interessante observar que a função de Hartogs é utilizada na prova da equivalência com o Axioma da Escolha de uma asserção que, num primeiro momento, parece ser inofensiva, trivial ou absolutamente intuitiva (e a qual, por conta dessa aparência tão intuitiva, muitos poderiam acreditar que a mesma deveria ser um teorema de \(\mathbf{ZF}\) – o que não é!). Seja então \(\mathbf{CC}\) (de “Comparação de Cardinalidades" ) a seguinte asserção:

“Se \(A\) e \(B\) são conjuntos quaisquer,
então \(A \preccurlyeq B\) ou \(B \preccurlyeq A\)

Ou seja, \(\mathbf{CC}\) simplesmente afirma que, dados dois conjuntos quaisquer, deveria ser verdade que poderíamos compará-los por funções injetoras, de modo a descobrir “qual dos dois conjuntos é o maior (por conter uma cópia do outro)”. \(\mathbf{CC}\) segue diretamente de \(\mathbf{AC}\) via \(\mathbf{WO}\): dados os conjuntos \(A\) e \(B\), por \(\mathbf{WO}\) podem ser ambos bem ordenados e portanto suas cardinalidades são definidas da maneira usual, e assim sendo \(\kappa = |A|\) e \(\lambda = |B|\), a tricotomia existente entre ordinais (logo, entre cardinais também) resolve a situação facilmente.

Por outro lado, \(\mathbf{CC}\) implica \(\mathbf{AC}\) (também via \(\mathbf{WO}\)): pois dado um conjunto \(A\) qualquer, considere \(B = H(A)\). Como \(B\) não pode ser dominado por \(A\) neste caso particular, vale \(A \preccurlyeq B\) por \(\mathbf{CC}\), e, por poder ser injetado no ordinal \(H(A)\), é imediato usar essa injeção para definir uma boa ordem em \(A\), o que verificaria que “todo conjunto pode ser bem ordenado”10.

Com estas definições e observações, principalmente no que se refere à Hierarquia dos Alephs, podemos retornar a nossa discussão sobre a Hipótese do Contínuo com uma outra linguagem: de fato, temos do Teorema de Cantor que \(\aleph_0<2^{\aleph_0}\), e, como \(\aleph_1\) é o sucessor de \(\aleph_0\), concluímos que \(\aleph_1\leq2^{\aleph_0}\). Assim, o que \(\mathbf{CH}\) diz é que nesta última expressão vale a igualdade, enquanto \(\neg\mathbf{CH}\) (a negação de \(\mathbf{CH}\)) diz que vale a desigualdade estrita.

Em suma, na linguagem dos alephs, o significado de \(\mathbf{CH}\) é justamente traduzido pela equação \[2^{\aleph_0}=\aleph_1\] – donde a reta teria o menor tamanho possível. E, utilizando este mesmo raciocínio, temos que para um ordinal \(\alpha\) vale \(\aleph_\alpha<2^{\aleph_\alpha}\), donde \(\aleph_{\alpha+1}\leq2^{\aleph_\alpha}\), e \(\mathbf{GCH}\) seria justamente a afirmação da igualdade para cada um dos ordinais \(\alpha\), isto é, é a afirmação de que vale \(2^{\aleph_\alpha}=\aleph_{\alpha+1}\), para cada \(\alpha\) ordinal (o que é claramente uma generalização de \(\mathbf{CH}\)).

hierarquia

Não obstante, observando que um conjunto arbitrário dado não necessariamente pode ser bem-ordenado em \(\mathbf{ZF}\) – e como o nosso objetivo neste artigo é justamente provar \(\mathbf{AC}\) (que é equivalente a \(\mathbf{WO}\)) assumindo \(\mathbf{GCH}\) em \(\mathbf{ZF}\), precisamos enunciar \(\mathbf{GCH}\) em uma versão que não faça referência aos números cardinais: com efeito, daqui pra frente \(\mathbf{GCH}\) será entendida como a seguinte asserção \((*)\):

“Para quaisquer conjuntos \(X\) e \(Y\) infinitos, se \(X\) é dominado por \(Y\), e este por sua vez é dominado por \(\mathcal{P}(X)\), então vale que \(X\) é equipotente a \(Y\) ou que \(Y\) é equipotente a \(\mathcal{P}(X)\).”

Assim, identificaremos, em \(\mathbf{ZF}\), a seguinte asserção \((\ast)\) com \(\mathbf{GCH}\):

\((\ast)\) “Para quaisquer \(X\) e \(Y\) infinitos,
\(X \preccurlyeq Y \preccurlyeq\mathcal{P}(X)\Longrightarrow X \approx Y\) ou \(Y \approx \mathcal{P}(X)\)."

Chamamos a atenção para o fato de que a asserção acima “plasma” a ausência de alternativas, digamos assim, que temos — em termos do tamanho de um conjunto infinito \(X\) — para os conjuntos que estejam “ensanduichados” entre o conjunto \(X\) e o conjunto de suas partes \(\mathcal{P}(X)\) (na comparação de tamanho por funções injetoras): um tal conjunto deverá ser equipotente ou a \(X\) ou a \(\mathcal{P}(X)\), não havendo possibilidades para “tamanhos intermediários”.

Resultados Intermediários

Com essas definições podemos apresentar alguns teoremas intermediários, cujas demonstrações fogem do escopo deste texto, por isso omitiremos.

O primeiro teorema estabelece uma importante característica dos cardinais infinitos que, obviamente, os diferencia dos cardinais finitos, que é a idempotência com respeito ao produto (seja produto cartesiano ou produto de cardinais):

(\(\mathbf{ZF}\)) Teorema Para todo \(\kappa\) cardinal infinito vale que \(\kappa\times\kappa\approx\kappa\).

Uma demonstração deste resultado pode ser encontrada em qualquer uma das principais referências modernas para a Teoria dos Conjuntos, como por exemplo (Jech 2003) ou (Kunen 1983). Como vimos que o Axioma da Escolha é equivalente ao Teorema da Boa Ordenação (donde cada conjunto infinito tem como cardinalidade um cardinal infinito \(\kappa\)), temos o seguinte corolário:

(\(\mathbf{ZF}\)) Corolário \(\mathbf{AC}\) implica que para todo \(X\) conjunto infinito vale que \(X\times X\approx X\).

Por fim, temos que a recíproca deste resultado também é verdadeira, num resultado que é atribuído a Tarski (de 1924), sendo sua prova uma argumentação bastante mais elaborada e que faz uso da função de Hartogs.

(\(\mathbf{ZF}\)) Teorema (Tarski) (Tarski 1924) Se para todo \(X\) conjunto infinito vale que \(X\times X\approx X\), então temos que \(\mathbf{AC}\) é válido.

Na última seção deste artigo voltaremos a dar destaque a esse resultado clássico de Tarski.

Com os dois últimos resultados, concluímos que em \(\mathbf{ZF}\) vale que \(\mathbf{AC}\) é equivalente à asserção “para todo \(X\) conjunto infinito vale a equipotência dada por\(X\times X\approx X\)”. No que segue, vamos utilizar exatamente essa conclusão para implicar o Axioma da Escolha.

Finalmente, observamos que a prova que apresentamos é levemente diferente daquela apresentada originalmente por Sierpiński em 1947 (Sierṕinski 1947), dado que incorporamos resultados provados logo depois (em 1954) por Specker (Specker 1954).

Resultados Principais

Chegamos agora aos principais resultados que gostaríamos de trabalhar, sendo o primeiro o já citado Teorema de Specker. A sua demonstração é relativamente longa, mas é aqui que está grande parte do trabalho, e após superarmos este desafio estaremos praticamente prontos para mostrar o resultado desejado. 11

(\(\mathbf{ZF}\)) Teorema de Specker (Specker 1954) Se \(X\) é um conjunto com pelo menos \(5\) elementos, então \(\mathcal{P}(X)\) não é dominado por \(X^2\) (isto é, \(\mathcal{P}(X)\npreccurlyeq X^2\)).

Observa-se que a hipótese deste teorema é extremamente razoável: ora, sabemos que para um conjunto \(X\) finito com \(n\) elementos vale que a cardinalidade do conjunto \(\mathcal{P}(X)\) é exatamente \(2^n\), enquanto que a cardinalidade de \(X\times X\) é \(n\cdot n=n^2\), e a expressão \(2^n\nleq n^2\) se verifica para todo número natural \(n\) maior ou igual a \(5\) (e note que \(2^4 = 4^2\)).

Já a idéia da demonstração consiste em tomar \(H(X)\), o número de Hartogs de \(X\), e, ao supor por absurdo que exista uma função \(f\colon\mathcal{P}(X)\rightarrow X^2\) que é injetiva, construir uma sequência injetora (com respeito aos índices) \(\langle x_\alpha\mid\alpha <H(X)\rangle\) de elementos de \(X\) com comprimento \(H(X)\), o que implicaria \(H(X)\preccurlyeq X\), uma contradição com a definição que demos para a função de Hartogs.

Sejam \(X\) conjunto e \(\lambda\coloneq H(X)\), e suponha por absurdo que exista uma \(f\colon\mathcal{P}(X)\rightarrow X^2\) função injetiva. Vamos construir uma sequência de elementos de \(X\) conforme o descrito anteriormente:

Primeiramente, dado que \(X\) tem pelo menos \(5\) elementos, podemos tomar \(x_0, x_1, x_2, x_3\) e \(x_4\) 2-a-2 distintos de forma arbitrária. A partir daí vamos argumentar indutivamente: seja \(n\) com \(5\leq n<\omega\) tal que \(\langle x_\alpha\mid\alpha<n\rangle\) é uma sequência injetora já construída; se \(n<\lambda\), aplicando a hipótese de indução vamos obter o elemento \(x_n\).

Considere \(C_n=\{x_\alpha\mid\alpha<n\}\), a imagem da sequência \(\langle x_\alpha\mid\alpha<n\rangle\). Note que dado um subconjunto \(U\) de \(C_n\) vale que \(U\) é um elemento de \(\mathcal{P}(X)\), donde podemos nos perguntar o que acontece com \(f(U)\).

Afirmamos que existe pelo menos um subconjunto \(U\) de \(C_n\) tal que \(f(U)\) não pertence a \(C_n\times C_n\), que é subconjunto de \(X^2\). Com efeito, esta afirmação é uma mera aplicação do bastante conhecido Princípio da Casa dos Pombos.

Suponha que não valesse a afirmação. Nesse caso, como sabemos que \(\mathcal{P}(C_n)\) tem \(2^n\) elementos e que \(C_n\times C_n\) tem \(n^2\) elementos (e \(n\geq 5\) implica \(2^n>n^2\)), estamos numa situação na qual “temos mais pombos do que casas”, isto é, existiriam dois subconjuntos \(U\) e \(U'\) de \(C_n\) distintos tais que \(f(U)=f(U')\), o que contradiz a assunção de \(f\) ser injetiva.

Assim, concluímos que existe pelo menos um \(U\subseteq C_n\) com \(f(U)\notin C_n\times C_n\). Além disso, temos que este \(U\) pode ser tomado de forma não arbitrária: para isso, dado que o conjunto dos subconjuntos finitos de \(\omega\) é um conjunto infinito enumerável, podemos tomar uma única vez uma enumeração sobre este conjunto e a partir daí induzir uma boa ordem natural em cada um dos conjuntos \(\mathcal{P}(C_n)\) identificando cada subconjunto de \(C_n\) pelo conjunto dos índices de seus elementos, os quais constitutem uma boa ordem pela enumeração fixada anteriormente12.

Com isso, conseguimos fixar construtivamente um \(U\subseteq C_n\) tal que \(f(U)\) é elemento do conjunto\(X\times X~\setminus~C_n\times C_n\), o que garante que alguma das duas coordenadas de \(f(U)\) não pertence a \(C_n\) de modo que podemos tomar essa coordenada como nosso próximo elemento da sequência que queremos definir.

Formalmente, definimos \(x_n\coloneq\pi_1\big(f(U)\big)\) caso valha que \(\pi_1\big(f(U)\big)\) não pertence a \(C_n\), e \(x_n\coloneq\pi_2\big(f(U)\big)\) no caso contrário. Assim, é claro que \(x_n\) está bem definido e é um elemento de \(X\) que não pertence a \(C_n\), de modo que a sequência \(\langle x_0, \ldots, x_{n-1}, x_n\rangle\) é, portanto, injetora.

Caso o conjunto \(X\) seja finito, temos que \(X\) é claramente bem ordenado, e \(|X|\) é um número natural, donde \(\lambda\) é simplesmente \(|X|+1\), e o argumento anterior é suficiente para provar o teorema.

Por outro lado, caso \(X\) não seja finito temos que \(\lambda\) é um cardinal infinito, donde \(\lambda\geq\omega\), e o argumento acima mostra que podemos construir uma sequência \(\langle x_\alpha\mid\alpha<\omega\rangle\) de elementos de \(X\) que é injetora.

Agora, se por acaso \(\omega<\lambda\), ainda devemos mostrar como expandir esta sequência. Para isso, vamos utilizar um argumento similar ao anteriormente feito:

Utilizando este último argumento como passo indutivo em uma indução sobre o cardinal \(\lambda\) temos que existe uma sequência \(\langle x_\alpha\mid\alpha<\lambda\rangle\) de elementos de \(X\) que é injetora.

Esta construção, como explicado no começo, é uma contradição com \(\lambda\) ser o número de Hartogs de \(X\), o que implica que tal não pode ser feita, donde não existe função de \(\mathcal{P}(X)\) em \(X^2\) injetiva, e o teorema está finalmente demonstrado.0◻

Superada esta demonstração, vejamos um corolário rápido que será diretamente utilizado para demonstrar o resultado principal. Para auxiliar a sua demonstração, vamos definir a União Disjunta de dois conjuntos \(A\) e \(B\) pondo \[A\oplus B\coloneq\big(A\times\{0\}\big)\cup\big(B\times\{1\}\big).\]

(\(\mathbf{ZF}\)) Corolário do Teorema de Specker Se \(X\) é um conjunto infinito e \(n\) é um número natural qualquer, então \(n\times X\) é estritamente dominado por \(\mathcal{P}(X)\), isto é, \(n\times X\prec\mathcal{P}(X)\).

Note que o resultado é imediato se \(n=0\), pois o produto cartesiano de \(n\) com \(X\) seria o conjunto vazio; além disso, se \(n=1\), estaremos diante do Teorema de Cantor, e o resultado é imediatamente verdadeiro. Assim, podemos assumir que \(n\) é maior ou igual a \(2\). Na verdade, para nosso objetivo final o caso que importará será precisamente \(n=2\).

Como \(X\) é um conjunto infinito e \(n\) é um número natural (maior ou igual a 2), podemos fixar um subconjunto \(Y\) de \(X\) com \(Y\) equipotente a \(n\), e escrever \(Y=\{y_j\mid j<n\}\).

Definindo \(Z\coloneq X~\setminus~Y\), temos que \(Z\) é um conjunto infinito, e que \(n\times X\) é a união disjunta entre \(n\times Z\) e \(n\times Y\).

Devido a isso, temos que \(n\times X\) é equipotente a\(\big((n\times Z)\oplus n^2\big)\), pois a função que leva \((i,z)\in n\times Z\) em \((i,z,0)\) e \((i,y_j)\in n\times Y\) em \(((i,j),1)\) claramente é bijetiva.

Por outro lado, como \(n^2\preccurlyeq Z\), e para todo \(n\geq 2\) vale que \(n\leq 2^{n-1}\), temos que \(\big((n\times Z)\oplus n^2\big)\) é dominado por \((2^{n-1}\times Z)\oplus Z\), que por sua vez é dominado por \((2^{n-1}+1)\times Z\).

Como este último é dominado por \(2^n\times Z\) concluímos que \(n\times X\preccurlyeq 2^n\times Z.\) Além disso, temos que \(2^n\times Z\) é equipotente a \(^n2\times Z\) (pois a quantidade de funções de \(n\) em \(2\) coincide com o tamanho do conjunto das partes de \(n\), que é igual a \(2^n\)), que por sua vez é equipotente a \(^Y2\times Z\).

Como pelo teorema de Cantor vale \(Z\preccurlyeq\mathcal{P}(Z)\approx {}^Z2\), temos que \(^Y2\times Z\) é dominado por \(^Y2\times{}^Z2\), que por sua vez é equipotente a \(^{Y\cup Z}2\), pois \(Y\) e \(Z\) são disjuntos.

Mas \(^{Y\cup Z}2\) é igual a \(^X2\), que é equipotente a \(\mathcal{P}(X)\). Concluímos assim que: \[\begin{matrix} n\times X&\preccurlyeq&2^n\times Z \\&\approx&{}^n2\times Z \\&\approx&{}^Y2\times Z& \\&\preccurlyeq&{}^Y2\times {}^Z2 \\&\approx&{}^{Y\cup Z}2& \\&=&{}^X2& \\&\approx&\mathcal{P}(X) \end{matrix}\] Portanto, vale que \(n\times X\) é dominado por \(\mathcal{P}(X)\). Contudo, se valesse a dominação reversa, teríamos que \(\mathcal{P}(X)\preccurlyeq n\times X \preccurlyeq X\times X=X^2\), contradizendo o Teorema de Specker.

Com isso segue que \(n\times X\preccurlyeq\mathcal{P}(X)\) e que, portanto, \(n\times X\not\approx\mathcal{P}(X)\).0◻

Finalmente chegamos ao resultado desejado.

(\(\mathbf{ZF}\)) Teorema de Sierpiński (Sierṕinski 1947) A Hipótese Generalizada do Contínuo implica o Axioma da Escolha: \[\underbrace{\mathbf{GCH}}_{(\ast)}\Longrightarrow\mathbf{AC}\]

Recordamos que para esta prova em \(\mathbf{ZF}\) estamos identificando \(\mathbf{GCH}\) com seu enunciado dado por \((\ast)\)14, e que em \(\mathbf{ZF}\) também vale que o Axioma da Escolha é equivalente à sua mais conhecida forma cardinal – que é aquela devida a Tarski e dada por “para todo conjunto infinito \(X\) vale que \(X^2\) é equipotente a \(X\)". Nesta demonstração vamos implicar esta última asserção.

Seja \(X\) um conjunto infinito. Assim, é imediato que \(X\) é dominado por \(2\times X\); pelo corolário anterior vale que \(2\times X\) é estritamente dominado por \(\mathcal{P}(X)\), ou seja, vale que: \[X\preccurlyeq 2\times X\prec\mathcal{P}(X).\] Como estamos assumindo \((\ast)\), esta expressão implica que \(X\) tem que ser equipotente a \(2\times X\).

Por outro lado, vale pelo teorema de Cantor que \(X^2\) é dominado por \(\big(\mathcal{P}(X)\big)^2\), que por sua vez é equipotente a \(\big(^X2\big)^2\), que também é equipotente a \(^2\big(^X2\big)\).

Como \(^2\big(^X2\big)\) é equipotente a \(^{2\times X}2\), e acabamos de mostrar que \(2\times X\) é equipotente a \(X\), concluímos que:

\[\begin{matrix} \big(X\big)^2&\preccurlyeq&\big(\mathcal{P}(X)\big)^2 \\&\approx&\big(^X2\big)^2 \\&\approx&^2\big(^X2\big) \\&\approx&^{2\times X}2 \\&\approx&^X2 \\&\approx&\mathcal{P}(X), \end{matrix}\]

donde segue que \(X^2\) é dominado por \(\mathcal{P}(X)\). Como pelo Teorema de Specker vale que \(\mathcal{P}(X)\npreccurlyeq X^2\), concluímos que \(X^2\prec\mathcal{P}(X)\).

Por fim, temos que \(X\preccurlyeq X^2\prec\mathcal{P}(X)\), donde novamente por \((\ast)\) vale que \(X\approx X^2\), como queríamos mostrar.0◻

Notas e Sugestões

Conforme já comentado, as demonstrações combinatórias (de Sierpiński e de Specker) para o resultado principal deste artigo valem-se diretamente, e de forma crucial, da equivalência de \(\mathbf{AC}\) na forma cardinal devida a Tarski (“Para todo conjunto \(X\) infinito vale que \(X^2 \approx X\)”). No que segue, apresentamos ao leitor mais interessado um roteiro de exercícios guiados os quais, quando combinados, consistem em uma prova da equivalência dessa asserção com o Axioma da Escolha.

Para este “sprint final", seguimos os passos da referência (Jech 1973). Lembre-se que, como estamos querendo ao final mostrar uma equivalência para o Axioma da Escolha, no que segue nós não podemos usar o Axioma da Escolha em nenhuma passagem, ou seja, os seguintes exercícios guiados devem ser realizados em \(\mathbf{ZF}\).

Iniciamos com um exercício que dá mais trabalho do que aparenta a princípio!

Exercício 0. Se \(A\) e \(B\) são conjuntos disjuntos, ambos possuindo mais do que um elemento, então \[A \cup B \preccurlyeq A \times B\,.\]

(Sugestão: Siga o seguinte roteiro:

Exercício 1. (Este é fácil! E é uma versão cardinal de um produto notável  !) Voltando a usar a notação da união disjunta \(\oplus\), mostre que, para quaisquer conjuntos \(A\) e \(B\), vale que\[(A \oplus B)^2 \approx A^2 \oplus(2 \times A \times B) \oplus B^2.\]

Exercício 2. Prove o seguinte:

Lema. Sejam \(A\) e \(B\) conjuntos, e suponha que \(B\) possa ser bem-ordenado. Nessas condições, se \(A \oplus B \approx A \times B\) então \(A \preccurlyeq B\) ou \(B \preccurlyeq A\).

Sugestão: Fixe inicialmente uma função bijetiva \(f\colon A \oplus B \rightarrow A \times B\) e uma boa ordem \(<\) sobre \(B\). A partir de agora daremos algumas indicações do que deve ser feito, mas as conclusões ficarão a cargo do leitor!!!

Pois bem: divida a demonstração em 2 casos:

Caso 1. Existe \(a \in A\) tal que \((a,b) \in f[A \times \{0\}]\) para todo \(b \in B\).

(Graficamente: “Existe uma coluna do produto cartesiano inteiramente contida na imagem de \(A \times \{0\}\)".)

Neste caso temos

\(B \approx\{(a,b): b \in B\} \subseteq\ldots\).

e neste caso teremos \(\ldots \preccurlyeq\ldots\)

Caso 2. Suponha que não vale o Caso 1. Neste caso, o conjunto \(X_a = \{b \in B: (a,b)\in f[B \times \{1\}]\}\) é não-vazio para todo \(a \in A\).

(Graficamente: “Toda coluna intersecta a imagem de \(B \times \{1\}\)".)

Como, por hipótese, \(B\) é bem ordenado por \(<\), use a boa ordem para definir \(g\colon A \rightarrow B\), pondo \(g(a) = \ldots\) (lembre-se do que significa \(B\) estar bem ordenado!). Segue agora que

\(A \approx\{(a,g(a)): a \in A\} \subseteq\ldots\)

e neste caso teremos \(\ldots \preccurlyeq \ldots\))

Exercício 3. (Surpreendentemente óbvio, se você se lembra da principal propriedade da função de Hartogs! E que todo subconjunto de um conjunto bem ordenado pode ser bem ordenado …) Prove o seguinte:

Corolário do Lema do Exercício 2. Seja \(A\) um conjunto infinito qualquer. Se vale que \[A \oplus H(A) \approx A \times H(A)\] então \(A\) pode ser bem-ordenado.

fluxo

Exercício 4. Prove o

Teorema de Tarski. São equivalentes, em \(\mathbf{ZF}\):

(1) \(\mathbf{AC}\).

(2) Para todo conjunto infinito \(X\) vale que \(X^2 \approx X\).

(Sugestão: Siga o seguinte roteiro:

Conclusão

Os autores se colocam à disposição dos leitores para dirimir quaisquer dúvidas que permaneçam após a leitura deste artigo, bem como em quaisquer questões outras que sejam relacionadas à Teoria dos Conjuntos.

Encerramos este artigo agradecendo aos colegas da Revista de Matemática Hipátia pela oportunidade (em particular, ao(à) anônimo(a) revisor(a), pela leitura cuidadosa do manuscrito), aos leitores por terem investido o seu tempo em nosso trabalho, e convidando todos a estudar essa belíssima disciplina que é a Teoria dos Conjuntos – lembrando que no Instituto de Matemática e Estatística da Universidade Federal da Bahia temos um Grupo de Pesquisa em Lógica do qual a Teoria dos Conjuntos é uma das linhas de investigação ativas, ou seja, não é necessário (e nem verdadeiro) pensar que a Teoria dos Conjuntos “pertence ao Museu da História da Matemática", mas sim que é uma área de pesquisa viva e muito apaixonante.

image

Samuel Gomes da Silva nasceu e cresceu em Pirituba (periferia de São Paulo), participou do movimento estudantil secundarista logo após o final do regime militar e teve formação em Matemática no IME/USP (licenciatura noturno na graduação, depois mestrado e doutorado, tendo concluído o doutoramento em 2004). Atualmente é professor titular no Departamento de Matemática da UFBA, onde ingressou em 2006. Antes de concluir sua graduação foi monitor de matemática na Estação Ciência (museu paulista de ciências, ligado à USP, atualmente fechado) e antes de concluir seu mestrado foi professor na rede pública do Estado de São Paulo, com destaque para o período em que lecionou no CEFAM Experimental da Lapa. Feliz proprietário de um Gol 90 branco quadrado. Lógico, topólogo e teorista de conjuntos. Pós-doutorados em Morelia, México (onde conheceu sua esposa Consuelo) e em Barcelona, Catalunha. Hoje se considera paulista, baiano, mexicano e catalão, não necessariamente nessa ordem (mas num quadrangular entre Corinthians, Bahia, Pumas e Barcelona, ainda torceria para o Corinthians). Membro de várias diretorias da Sociedade Brasileira de Lógica desde 2011, sendo atualmente 2o. Vice Presidente. Foi coordenador da Comissão Organizadora do XX Encontro Brasileiro de Lógica, realizado em Salvador em 2022.

image

Nascido na seca cidade de Caculé, no sertão da Bahia, Diego Lima Bomfim peregrinou por considerável parte do Estado: fez o ensino médio e técnico na fria Vitória da Conquista, formou-se em Matemática na calorosa São Salvador — onde também concluiu o mestrado e iniciou o doutorado — e é, desde 2024, professor efetivo do Instituto Federal de Educação, Ciência e Tecnologia da Bahia (IFBA), na chuvosa cidade de Valença. Medalhista da OBMEP na juventude, tornou-se pai no mesmo ano em que assumiu o cargo de professor e agora se divide entre equações e as traquinagens de Vinicius, um menino sapeca, curioso, cheio de energia e imaginação – típico de um episódio de Os Anjinhos. Flamenguista de coração e fã de esportes em geral, acredita que a matemática, assim como o futebol, é melhor quando compartilhada.

Bibliografia

Caicedo, Andrés. “580 - Some Choiceless Results (3).” Updated Tuesday, January 27th, 2009. https://andrescaicedo.wordpress.com/2009/01/27/580-some-choiceless-results-3/.
Engelking, R., General Topology. 2nd ed. Vol. 6. Sigma Series in Pure Mathematics. Berlin: Heldermann Verlag, 1989, viii+529 pp.
Jech, T. The Axiom of Choice. Vol. 75. Studies in Logic and the Foundations of Mathematics. North-Holland, Amsterdam, 1973.
———. 2003. Set Theory – the Third Millennium Edition, Revised and Expanded. Springer Monographs in Mathematics. Berlin: Springer-Verlag.
de Jesus, J. P. C., e da Silva S. G. (2007) Cem Anos do Axioma da Escolha: Boa Ordenação, Lema de Zorn e o Teorema de Tychonoff.” Revista Matemática Universitária (RMU/SBM) 42: 16–34.
Kunen, K., Set Theory – an Introduction to Independence Proofs. Vol. 102. Studies in Logic and the Foundations of Mathematics. Amsterdam: North-Holland Publishing Co, 1983.
Lévy, A. , Basic Set Theory. Berlin-New York: Springer-Verlag, 1979.
Sierṕinski, W. “L’hypothèse Généralisée Du Continu Et l’axiome Du Choix.” Fundamenta Mathematicae 34 (1) (1947): 1–5.
Specker, E., Verallgemeinerte Kontinuumshypothese und Auswahlaxiom.” Archiv Der Mathematik 5 (1954): 332–37.
Tarski, A. “Sur Quelques Théorèmes Qui Équivalent à l’axiome Du Choix.” Fundamenta Mathematicae 5.1 (1924): 147–54.
Zermelo, E., Beweis, dass jede Menge wohlgeordnet werden kann (Aus einem an Herrn Hilbert gerichteten Briefe).” Mathematische Annalen 59 (1904): 514–16.
———. Neuer Beweis für die Möglichkeit einer Wohlordnung.” Mathematische Annalen 65 (1908): 107–28.
———. Untersuchungen über die Grundlagen der Mengenlehre. I.” Mathematische Annalen 65 (1908): 261–81.

  1. Uma função-escolha para uma família \(\mathcal{F}\) de conjuntos não-vazios é uma função que efetivamente “escolhe” um elemento de cada um dos membros da família, mais precisamente é uma aplicação \(f\colon \mathcal{F} \to \bigcup \mathcal{F}\) satisfazendo \(f(F) \in F\) para todo \(F \in \mathcal{F}\).↩︎

  2. Para um enunciado e demonstração do Teorema de Tychonoff — o qual declara que todo produto de espaços topológicos compactos é compacto —, indicamos nossa principal referência em Topologia Geral, que é (Engelking 1989). Uma prova (em português) da equivalência entre \(\mathbf{AC}\) e o Teorema de Tychonoff pode ser encontrada em (Jesus and Silva 2007).↩︎

  3. A necessidade desta ressalva advém da transição de uma pergunta específica para uma asserção de caráter universal. Com efeito, enquanto a formulação original de Cantor se restringe a subconjuntos da reta real, a afirmação de que não existe nenhuma cardinalidade intermediária em todo o universo dos conjuntos requer que todas as cardinalidades, de todos os conjuntos, possam ser dispostos em uma única hierarquia ordenada — propriedade esta que é garantida precisamente pelo Teorema da Boa Ordenação, sob o qual todos os conjuntos possuem “ordinais iniciais” — i.e., “alephs” — como suas cardinalidades.↩︎

  4. Note que esta formulação é equivalente à apresentada anteriormente: por definição, um elemento do produto cartesiano de uma família de conjuntos \(\mathcal{F}\) é uma função a qual, também, “escolhe” exatamente um elemento de cada conjunto \(F \in \mathcal{F}\).↩︎

  5. Uma ordem sobre um conjunto é dita ser uma boa ordem se for uma ordem total na qual todo subconjunto não-vazio admite elemento mínimo. O exemplo canônico é o conjunto dos números naturais com a ordem usual.↩︎

  6. Observamos que a singela notação “” tem aqui um papel fundamental, pois sinaliza que o resultado pode ser demonstrado utilizando-se apenas os axiomas de Zermelo-Fraenkel, ou seja, sem a necessidade de se invocar o Axioma da Escolha. Este é um fato crucial para a nossa discussão, uma vez que estamos estabelecendo ferramentas para comparar conjuntos em um ambiente onde \(\mathbf{AC}\) não é pressuposto.↩︎

  7. Notar que, sob o Axioma da Escolha, todo conjunto poderá ser bem-ordenado, e assim essa definição que demos para a cardinalidade - à qual sempre nos referiremos como sendo a definição usual - poderá ser aplicada uniformemente para todos os conjuntos.↩︎

  8. \(H(x)\) é o menor ordinal que não pode ser injetado em \(x\) exatamente pelo fato dele ser, estruturalmente digamos, exatamente o conjunto de todos os ordinais que podem ser injetados em \(x\)!!↩︎

  9. Um ordinal \(\gamma\) é dito ser um ordinal limite se ele não for o zero e tampouco for um ordinal sucessor, isto é, não existir nenhum ordinal \(\beta\) tal que \(\gamma = \beta \cup \{\beta\} = \beta + 1\). De forma intuitiva, são os ordinais que não possuem um antecessor imediato, como é o caso de \(\omega\), o primeiro ordinal limite.↩︎

  10. Em particular, temos aqui um dos principais “monstros” que aparecem na ausência do Axioma da Escolha: em um modelo de \(\mathbf{ZF}\) no qual \(\mathbf{AC}\) seja falso, seguramente existem conjuntos que são incomparáveis segundo a relação de dominação – de modo que não teremos como saber qual dos dois é o maior conjunto!↩︎

  11. Para nossa demonstração do resultado de Specker, bem como dos passos subsequentes até chegarmos na verificação de que \(\mathbf{GCH}\) implica \(\mathbf{AC}\), seguimos as linhas da exposição de Lévy no seu clássico livro (Lévy 1979).↩︎

  12. Em particular, o nosso argumento indutivo pode ser, na verdade, tornado recursivo – no sentido de que existe, essencialmente, um algoritmo recursivo bem definido para a construção dessa sequência.↩︎

  13. Essa bijeção canônica \(f_\beta\) é bastante menos conhecida do que aquela existente entre um cardinal \(\kappa\) e seu quadrado \(\kappa \times \kappa\) (dado que esta última está presente na maioria dos livros-texto). O leitor mais curioso poderá encontrar uma descrição de sua construção no blog de Andrés Caicedo (Caicedo 2009).↩︎

  14. “Para quaisquer \(X\) e \(Y\) infinitos, \(X \preccurlyeq Y \preccurlyeq\mathcal{P}(X)\Longrightarrow X \approx Y\) ou \(Y \approx \mathcal{P}(X)\)."↩︎